목록개발이야기 (528)
준호씨의 블로그
Microsoft GraphRAG 오픈소스 컨트리뷰터 7위까지 올라온 기념으로 남겨봅니다. (GraphRAG는 Advanced RAG 기법 중 하나로 지식그래프를 이용한 RAG 기법입니다.)커밋 다섯 개 했고, 수정 내용은 14라인 정도밖에 안 되지만 벌써 7위가 되었네요. 좀 더 하다 보면 5위권 까지도 갈 수 있지 않을까 싶지만 그 위로는 쉽지 않을 것 같습니다. 다섯 개 커밋 내용은 사소한 오타 수정이나 문서 수정 정도인데요. 아직 라이브러리가 나온 지 오래되지 않다 보니 기능 변화가 자주 있고, 그 과정에서 이런저런 오타나 문서 갱신이 덜 된 경우가 종종 보입니다. 그래서 기여할 기회가 많은 편입니다. 제가 PR 했던 내용은 링크에서 확인해 볼 수 있습니다. 간단한 코드 수정 PR도 했었긴 한데요..
GraphRAG 라이브러리 v0.3.3 릴리즈가 되고 얼마 지나지 않아 바로 v0.3.4가 릴리즈 되었습니다. 다만 아직 github에 release 페이지가 생기지 않아서 Release v0.3.4 커밋 내용을 참고하였습니다. 이번 릴리스는 두 가지 패치를 포함하고 있어, 라이브러리의 안정성과 기능성을 한층 향상했습니다. 변경 사항을 자세히 살펴보겠습니다. 주요 변경 사항1. 로컬 검색에서의 경쟁 상태 방지첫 번째 패치는 로컬 검색 과정에서 발생할 수 있는 경쟁 상태(race condition)를 방지하기 위한 것입니다. 구체적으로, 텍스트 단위(text units)에 대해 깊은 복사(deep copy)를 수행하도록 변경되었습니다.변경 내용: "Deep copy txt units on local sea..
Microsoft의 GraphRAG 라이브러리가 0.3.3 버전으로 업데이트되었습니다. 이번 릴리스는 주로 버그 수정과 기능 개선에 초점을 맞추었으며, 사용자 경험을 향상하는 여러 변경 사항을 포함하고 있습니다. 주요 업데이트 내용을 살펴보겠습니다.주요 변경 사항1. 증분 인덱싱 지원 (정정: 옵션만 추가되었고, 실제 기능 구현은 안되어 있는 것 같습니다 ㅠㅠ)증분 인덱싱을 위한 엔트리포인트가 추가되었습니다. 이를 통해 대규모 데이터셋의 효율적인 업데이트가 가능해졌습니다.새로운 데이터를 추가할 때 인덱싱 작업을 처음부터 다시 하는 것이 아니고, 완료된 데이터에서 추가하는 것이 가능해졌습니다. 아직 데이터 삭제나 추가된 데이터 수정은 지원하지 않지만, 새로운 데이터를 추가하는 것은 가능해진 것입니다.cli..
LLM 모델을 테스트해 볼 때 제가 주로 사용하는 질문은 "구구단 프로그램을 만들어줘", "세종대왕의 맥북던짐 사건에 대해 이야기해 줘" 같은 질문들입니다. 좀 새로운 질문들을 해 보면 좋겠다 싶어서 Claude에게 "LLM 모델을 테스트해 보기 좋은 질문 추천해 줘"라고 질문해 보았습니다. 복잡한 추론: "지구 온난화가 해수면 상승에 미치는 영향과 그로 인한 경제적 결과를 설명해 주세요."창의성: "고양이와 우주여행을 주제로 한 단편 소설의 줄거리를 만들어보세요."다국어 능력: "'사랑'이라는 단어를 5개 다른 언어로 번역하고, 각 문화에서 그 의미가 어떻게 다른지 설명해 주세요."수학적 문제 해결: "복리 이자로 연 5%의 이율을 적용할 때, 1000만 원이 2000만 원이 되는 데 걸리는 시간을 계..
데이터 과학, 머신러닝, 그리고 다양한 연구 프로젝트에서 Jupyter Lab은 필수 도구로 자리 잡았습니다. 특히 원격 서버에서 무거운 작업을 처리하고자 할 때, Jupyter Lab을 원격으로 접속할 수 있는 방법은 매우 유용합니다. 이번 포스팅에서는 원격 서버에서 Jupyter Lab을 실행하고 원격으로 접속할 수 있는 방법을 단계별로 소개하겠습니다.1. Jupyter Lab 설치원격 서버에 Jupyter Lab을 설치합니다.$ conda install -c conda-forge jupyterlab 만약 conda를 사용하지 않는 환경이라면 pip로 설치합니다.$ pip install jupyterlab 설치에 대한 자세한 내용은 공식문서를 참고합니다. 2. Jupyter Lab 설정 파일 생성기본..