목록머신러닝 (2)
준호씨의 블로그
Whisper는 OpenAI가 개발한 자동 음석 인식(ARS) 모델입니다. 다양한 언어와 억양을 이해하고 텍스트로 변환할 수 있습니다. 요즘 음성을 텍스트로 변환하는 다양한 도구들과 AI 모델, 서비스들이 나오고 있는데요. 아직 Whisper를 능가하는 경우를 보진 못했습니다. Whisper 모델을 사용하려면 보통은 OpenAI의 API를 생각할 수 있는데요.Whisper 모델을 OpenAI를 통해 사용하게 되면 1분에 $0.006입니다. 1시간짜리 음성을 인식시키게 되면 $0.36으로 500원 정도를 사용하게 됩니다. 비싼 가격은 아니지만 이것저것 사용하다 보면 비용을 무시하진 못할 것 같습니다. Whisper 모델은 공개되어 있기 때문에 OpenAI API를 이용하지 않고 직접 Whisper 모델을 ..
나는 아직 머신러닝에 대해서 잘 모른다. 그냥 기계가 학습해서 결과의 정확도를 높이는 데 활용 할 수 있다 라는 거 정도.최근에는 이름있는 IT 기업들에서 머신러닝 기술을 오픈소스로 풀고 있고 이미 머신러닝을 활용한 다양한 기술들이 등장하고 있다.내 주변에 머신러닝이라는 단어가 자꾸 얼쩡 거리는 거로 봐서 언젠가는 직접적으로 무언가를 해야 될 것 같은 느낌이다. 내가 머신러닝에 대해서 처음 접했던 것은 대략 11년 전 인가? 20살 때인가 21살 때 인가 동아리 전시회를 준비 할 때 였음. 2004년인가 2005년 정도 되었을 듯. 사실 그 당시 머신러닝에 대해서는 들어본 적 없고 뉴럴 네트워크에 대해서만 들어 보았다. 동아리의 고참 선배가 음성인식 기술을 뉴럴네트워크(인공신경망)를 이용해서 구현 하고 ..