목록AI (7)
준호씨의 블로그
AI 특강 시간에 claude로 가사 쓰고, suno로 노래 만들고, hedra로 캐릭터 만들고 노래랑 합쳐서 만든 뮤직비디오입니다. 제작 과정을 간단히 정리하였습니다.Claude로 가사 생성suno에서도 가사를 생성해 주지만 ChatGPT나 Claude를 이용하면 가사를 더 잘 써준다고 하여 Claude를 이용해서 가사를 생성하였습니다.SUNO에서 노래 생성앞서 생성한 가사를 SUNO에 넣고 노래를 생성합니다.기본적으로 노래가 2개씩 생성됩니다. 생각보다 노래 생성도 빠르고 음악에 맞는 이미지도 생성해 줍니다.hedra에서 캐릭터 생성예전에 찍은 사진을 이용해서 캐릭터를 생성하였습니다. hedra서비스를 이용하였습니다.hedra에서 비디오 생성앞서 생성한 노래와 캐릭터를 hedra 비디오 생성기에 넣고..
Microsoft의 GraphRAG 라이브러리가 v0.4.1 버전으로 업데이트되었습니다. v0.4.0 릴리스 후 몇 가지 개선 및 버그패치가 있었습니다. 주요 변경사항증분 인덱싱(incremental indexing) cli 엔트리포인트 업데이트증분 인덱싱 중 빈 deltas에서 오류 발생증분 인덱싱에서 선택적 공변량 업데이트 수정Streaming 출력 오류 수정시각화 문서 추가 설치 및 업그레이드최신 버전을 설치하려면 다음 명령을 사용하세요.pip install graphrag==0.4.1기존 설치를 업그레이드하려면 다음 명령을 사용하세요.pip install --upgrade graphrag
Microsoft GraphRAG 오픈소스 컨트리뷰터 7위까지 올라온 기념으로 남겨봅니다. (GraphRAG는 Advanced RAG 기법 중 하나로 지식그래프를 이용한 RAG 기법입니다.)커밋 다섯 개 했고, 수정 내용은 14라인 정도밖에 안 되지만 벌써 7위가 되었네요. 좀 더 하다 보면 5위권 까지도 갈 수 있지 않을까 싶지만 그 위로는 쉽지 않을 것 같습니다. 다섯 개 커밋 내용은 사소한 오타 수정이나 문서 수정 정도인데요. 아직 라이브러리가 나온 지 오래되지 않다 보니 기능 변화가 자주 있고, 그 과정에서 이런저런 오타나 문서 갱신이 덜 된 경우가 종종 보입니다. 그래서 기여할 기회가 많은 편입니다. 제가 PR 했던 내용은 링크에서 확인해 볼 수 있습니다. 간단한 코드 수정 PR도 했었긴 한데요..
Microsoft의 GraphRAG 라이브러리가 0.3.3 버전으로 업데이트되었습니다. 이번 릴리스는 주로 버그 수정과 기능 개선에 초점을 맞추었으며, 사용자 경험을 향상하는 여러 변경 사항을 포함하고 있습니다. 주요 업데이트 내용을 살펴보겠습니다.주요 변경 사항1. 증분 인덱싱 지원 (정정: 옵션만 추가되었고, 실제 기능 구현은 안되어 있는 것 같습니다 ㅠㅠ)증분 인덱싱을 위한 엔트리포인트가 추가되었습니다. 이를 통해 대규모 데이터셋의 효율적인 업데이트가 가능해졌습니다.새로운 데이터를 추가할 때 인덱싱 작업을 처음부터 다시 하는 것이 아니고, 완료된 데이터에서 추가하는 것이 가능해졌습니다. 아직 데이터 삭제나 추가된 데이터 수정은 지원하지 않지만, 새로운 데이터를 추가하는 것은 가능해진 것입니다.cli..
Whisper는 OpenAI가 개발한 자동 음석 인식(ARS) 모델입니다. 다양한 언어와 억양을 이해하고 텍스트로 변환할 수 있습니다. 요즘 음성을 텍스트로 변환하는 다양한 도구들과 AI 모델, 서비스들이 나오고 있는데요. 아직 Whisper를 능가하는 경우를 보진 못했습니다. Whisper 모델을 사용하려면 보통은 OpenAI의 API를 생각할 수 있는데요.Whisper 모델을 OpenAI를 통해 사용하게 되면 1분에 $0.006입니다. 1시간짜리 음성을 인식시키게 되면 $0.36으로 500원 정도를 사용하게 됩니다. 비싼 가격은 아니지만 이것저것 사용하다 보면 비용을 무시하진 못할 것 같습니다. Whisper 모델은 공개되어 있기 때문에 OpenAI API를 이용하지 않고 직접 Whisper 모델을 ..