목록개발이야기 (529)
준호씨의 블로그

기다리고 기다리던 GraphRAG v0.4.0 가 릴리스되었습니다. (이전에는 1, 2주마다 패치되다가 이번에는 무려 1달 반 정도의 시간이 걸렸습니다) 마이너 버전이 3에서 4로 바뀐 만큼 다양한 기능 개선을 포함하고 있습니다. (제가 문서 수정한 커밋도 무려 4개나 포함되어 있습니다 🥰) 주요 변경 사항은 다음과 같습니다.주요 기능 추가점진적 인덱싱(Incremental Indexing) 기능 추가DRIFT 그래프 추론 쿼리 모듈 추가DRIFT 검색 CLI 및 예제 노트북 추가개선 사항점진적 업데이트를 위한 설정 추가임베딩을 서브플로우에 추가임베딩 워크플로우 변경시간 주기를 사용한 naive 커뮤니티 병합 기능 추가관계 병합 기능 추가런타임 전용 스토리지 옵션 추가텍스트 유닛 업데이트 기능 추가최적..

Microsoft GraphRAG 오픈소스 컨트리뷰터 7위까지 올라온 기념으로 남겨봅니다. (GraphRAG는 Advanced RAG 기법 중 하나로 지식그래프를 이용한 RAG 기법입니다.)커밋 다섯 개 했고, 수정 내용은 14라인 정도밖에 안 되지만 벌써 7위가 되었네요. 좀 더 하다 보면 5위권 까지도 갈 수 있지 않을까 싶지만 그 위로는 쉽지 않을 것 같습니다. 다섯 개 커밋 내용은 사소한 오타 수정이나 문서 수정 정도인데요. 아직 라이브러리가 나온 지 오래되지 않다 보니 기능 변화가 자주 있고, 그 과정에서 이런저런 오타나 문서 갱신이 덜 된 경우가 종종 보입니다. 그래서 기여할 기회가 많은 편입니다. 제가 PR 했던 내용은 링크에서 확인해 볼 수 있습니다. 간단한 코드 수정 PR도 했었긴 한데요..

GraphRAG 라이브러리 v0.3.3 릴리즈가 되고 얼마 지나지 않아 바로 v0.3.4가 릴리즈 되었습니다. 다만 아직 github에 release 페이지가 생기지 않아서 Release v0.3.4 커밋 내용을 참고하였습니다. 이번 릴리스는 두 가지 패치를 포함하고 있어, 라이브러리의 안정성과 기능성을 한층 향상했습니다. 변경 사항을 자세히 살펴보겠습니다. 주요 변경 사항1. 로컬 검색에서의 경쟁 상태 방지첫 번째 패치는 로컬 검색 과정에서 발생할 수 있는 경쟁 상태(race condition)를 방지하기 위한 것입니다. 구체적으로, 텍스트 단위(text units)에 대해 깊은 복사(deep copy)를 수행하도록 변경되었습니다.변경 내용: "Deep copy txt units on local sea..

Microsoft의 GraphRAG 라이브러리가 0.3.3 버전으로 업데이트되었습니다. 이번 릴리스는 주로 버그 수정과 기능 개선에 초점을 맞추었으며, 사용자 경험을 향상하는 여러 변경 사항을 포함하고 있습니다. 주요 업데이트 내용을 살펴보겠습니다.주요 변경 사항1. 증분 인덱싱 지원 (정정: 옵션만 추가되었고, 실제 기능 구현은 안되어 있는 것 같습니다 ㅠㅠ)증분 인덱싱을 위한 엔트리포인트가 추가되었습니다. 이를 통해 대규모 데이터셋의 효율적인 업데이트가 가능해졌습니다.새로운 데이터를 추가할 때 인덱싱 작업을 처음부터 다시 하는 것이 아니고, 완료된 데이터에서 추가하는 것이 가능해졌습니다. 아직 데이터 삭제나 추가된 데이터 수정은 지원하지 않지만, 새로운 데이터를 추가하는 것은 가능해진 것입니다.cli..

LLM 모델을 테스트해 볼 때 제가 주로 사용하는 질문은 "구구단 프로그램을 만들어줘", "세종대왕의 맥북던짐 사건에 대해 이야기해 줘" 같은 질문들입니다. 좀 새로운 질문들을 해 보면 좋겠다 싶어서 Claude에게 "LLM 모델을 테스트해 보기 좋은 질문 추천해 줘"라고 질문해 보았습니다. 복잡한 추론: "지구 온난화가 해수면 상승에 미치는 영향과 그로 인한 경제적 결과를 설명해 주세요."창의성: "고양이와 우주여행을 주제로 한 단편 소설의 줄거리를 만들어보세요."다국어 능력: "'사랑'이라는 단어를 5개 다른 언어로 번역하고, 각 문화에서 그 의미가 어떻게 다른지 설명해 주세요."수학적 문제 해결: "복리 이자로 연 5%의 이율을 적용할 때, 1000만 원이 2000만 원이 되는 데 걸리는 시간을 계..