Notice
Recent Posts
Recent Comments
목록2024/07 (6)
준호씨의 블로그
Colab에서 OpenAI Whisper 모델을 이용해서 무료로 자막 생성하기
Whisper는 OpenAI가 개발한 자동 음석 인식(ARS) 모델입니다. 다양한 언어와 억양을 이해하고 텍스트로 변환할 수 있습니다. 요즘 음성을 텍스트로 변환하는 다양한 도구들과 AI 모델, 서비스들이 나오고 있는데요. 아직 Whisper를 능가하는 경우를 보진 못했습니다. Whisper 모델을 사용하려면 보통은 OpenAI의 API를 생각할 수 있는데요.Whisper 모델을 OpenAI를 통해 사용하게 되면 1분에 $0.006입니다. 1시간짜리 음성을 인식시키게 되면 $0.36으로 500원 정도를 사용하게 됩니다. 비싼 가격은 아니지만 이것저것 사용하다 보면 비용을 무시하진 못할 것 같습니다. Whisper 모델은 공개되어 있기 때문에 OpenAI API를 이용하지 않고 직접 Whisper 모델을 ..
개발이야기/인공지능
2024. 7. 1. 00:07