준호씨의 블로그

GraphRAG 라이브러리 v0.3.3 릴리스 본문

개발이야기/인공지능

GraphRAG 라이브러리 v0.3.3 릴리스

준호씨 2024. 9. 11. 21:43
반응형

Microsoft의 GraphRAG 라이브러리가 0.3.3 버전으로 업데이트되었습니다. 이번 릴리스는 주로 버그 수정과 기능 개선에 초점을 맞추었으며, 사용자 경험을 향상하는 여러 변경 사항을 포함하고 있습니다. 주요 업데이트 내용을 살펴보겠습니다.

주요 변경 사항

1. 증분 인덱싱 지원 (정정: 옵션만 추가되었고, 실제 기능 구현은 안되어 있는 것 같습니다 ㅠㅠ)

  • 증분 인덱싱을 위한 엔트리포인트가 추가되었습니다. 이를 통해 대규모 데이터셋의 효율적인 업데이트가 가능해졌습니다.
  • 새로운 데이터를 추가할 때 인덱싱 작업을 처음부터 다시 하는 것이 아니고, 완료된 데이터에서 추가하는 것이 가능해졌습니다. 아직 데이터 삭제나 추가된 데이터 수정은 지원하지 않지만, 새로운 데이터를 추가하는 것은 가능해진 것입니다.
  • cli 옵션에 --update-index 가 추가 된 것을 확인할 수 있습니다.

정정: 옵션만 추가되었고 실제 기능은 아직 적용된 것 같지 않습니다. 관련 코드를 찾아보면 아직 TODO 상태인 것으로 보입니다.

https://github.com/microsoft/graphrag/compare/v0.3.2...v0.3.3#diff-a63b2d5a598d28bc57493dc8519f8a07066537626ec8bba21980757fb0f99af2R115

 

GitHub - microsoft/graphrag: A modular graph-based Retrieval-Augmented Generation (RAG) system

A modular graph-based Retrieval-Augmented Generation (RAG) system - microsoft/graphrag

github.com

 

2. 구성 및 코드 정리

  • 인덱스 실행 코드가 정리되고 체계화되었습니다.
  • 설정 로딩 과정이 일관되게 개선되어 이슈 #99#1049가 해결되었습니다.

3. 버그 수정

  • 프롬프트 튜닝 API를 직접 실행할 때 발생하던 순환 의존성 문제가 해결되었습니다.
  • 임베딩의 기본 설정이 수정되었습니다.
  • 프롬프트 튜닝 과정에서 발견된 버그가 수정되었습니다.

4. Azure Blob Storage 지원

  • Azure Blob Storage에서 직접 쿼리 할 수 있는 기능이 추가되었습니다.

5. 문서 및 이미지 개선

  • 자동 튜닝을 위한 이미지가 수정되었습니다.
  • 프롬프트 튜닝 문서가 업데이트되었습니다.

6. 기타 개선 사항

  • 로컬 검색(Local Search) 시 텍스트 단위 구축 과정이 리팩터링 되었습니다.
  • 파일 시스템을 사용하지 않을 때 base_dir을 전체 경로로 설정하는 문제가 수정되었습니다.
  • 엔티티 추출(entity_extraction)에서 전략 설정이 개선되었습니다.

결론

GraphRAG 0.3.3 릴리스는 라이브러리의 안정성과 사용성을 크게 향상했습니다. 증분 인덱싱 지원, Azure Blob Storage 통합, 그리고 다양한 버그 수정은 사용자들에게 더 나은 경험을 제공할 것으로 기대됩니다.

개발자들은 이번 업데이트를 통해 더욱 효율적이고 안정적인 GraphRAG 사용이 가능해질 것입니다. 자세한 내용은 GitHub 릴리스 페이지에서 확인할 수 있습니다.

GraphRAG를 사용 중이거나 사용을 고려 중이라면, 이번 0.3.3 버전으로 업그레이드하는 것을 추천드립니다. 새로운 기능과 개선된 성능을 직접 경험해 보세요!

반응형
Comments