목차
기존 RAG(Retrieval-Augmented Generation) 시스템은 문서를 청크(chunk)로 잘라 벡터 검색으로 관련 조각을 찾는 방식이다. 특정 사실을 찾는 데는 효과적이지만, 여러 개념 간의 관계나 전체 맥락을 이어야 하는 질문에는 한계가 있다. LightRAG는 홍콩대학교 데이터과학 연구팀(HKUDS)이 개발해 EMNLP 2025에 발표한 그래프 기반 RAG 시스템으로, 인덱싱 단계에서 LLM이 문서로부터 엔티티(entity)와 관계(relation)를 추출해 지식 그래프(knowledge graph)를 구성한다. 이를 통해 단순 벡터 검색보다 풍부하고 맥락적인 답변을 생성할 수 있다. GitHub ★33.3K, Forks 4.7K.
GitHub: https://github.com/HKUDS/LightRAG 논문: https://arxiv.org/abs/2410.05779
누구에게 유용한가?
- 지식 집약적인 문서 Q&A가 필요한 개발자: 법률 문서, 기술 매뉴얼, 연구 논문처럼 개념 간 관계가 중요한 문서에서 맥락 있는 검색이 필요할 때
- 사내 지식 베이스를 구축하는 팀: 방대한 내부 문서에 대해 AI가 구조화된 이해를 기반으로 답변하길 원할 때
- RAG 시스템을 연구하는 개발자·연구자: 그래프 기반 RAG의 이론과 구현을 탐구할 때
기존 RAG와의 차이
| 항목 | 기존 벡터 RAG | LightRAG |
|---|---|---|
| 인덱스 구조 | 청크 벡터 | 지식 그래프 + 벡터 |
| 관계 이해 | 없음 | 엔티티-관계 그래프 |
| 검색 방식 | 유사도 검색 | 로컬/글로벌/하이브리드 |
| 맥락 연결 | 제한적 | 개념 수준 연결 가능 |
| LLM 요구 수준 | 낮음 | 높음 (32B+ 권장) |
쿼리 모드
LightRAG는 다섯 가지 쿼리 모드를 지원한다.
| 모드 | 설명 | 적합한 상황 |
|---|---|---|
naive | 기본 벡터 검색 | 단순한 사실 검색 |
local | 엔티티 중심 그래프 탐색 | 특정 사실·세부사항 |
global | 개념 수준 그래프 탐색 | 전체 맥락·주제 이해 |
hybrid | local + global 조합 | 복합적인 질문 |
mix | Reranker 활용 조합 | 권장 기본값 |
LLM 및 임베딩 요구사항
LightRAG는 인덱싱 단계에서 LLM이 엔티티-관계를 추출하므로, 일반 RAG보다 모델 품질 요구가 높다.
- LLM: 최소 32B 파라미터 권장, 컨텍스트 길이 32KB 이상 (64KB 권장)
- 임베딩: 고성능 다국어 모델 권장 —
BAAI/bge-m3,text-embedding-3-large - Reranker:
BAAI/bge-reranker-v2-m3등 (mix 모드 성능 대폭 향상) - 주의: 임베딩 모델은 인덱싱 전에 결정하고 쿼리 시에도 동일 모델을 사용해야 한다. 변경 시 벡터 테이블 재생성 필요.
주요 기능
- Web UI: 문서 인덱싱, 지식 그래프 시각화, 쿼리 인터페이스
- Ollama 호환 인터페이스: Open WebUI 등에서 채팅 모델로 사용 가능
- 인용 지원: 출처 표시 및 문서 추적성
- 멀티모달 지원: RAG-Anything 통합으로 PDF·이미지·Office 문서·표·수식 처리
- 다양한 스토리지 백엔드: PostgreSQL, MongoDB, Neo4j, Redis, OpenSearch 등
설치
권장: Web UI + API 서버
uv tool install "lightrag-hku[api]"
lightrag-serverDocker Compose
git clone https://github.com/HKUDS/LightRAG.git
cd LightRAG
cp env.example .env
docker compose up코어만 사용 (Python)
pip install lightrag-hkuimport os
os.environ["OPENAI_API_KEY"] = "sk-..."
# examples/lightrag_openai_demo.py 참고라이선스
MIT 라이선스로 공개되어 있어 학술 및 상업적 목적으로 자유롭게 사용, 수정, 배포할 수 있다.
관련 문서
관련 HKUDS 프로젝트:
- RAG-Anything: 멀티모달 올인원 RAG 시스템
- VideoRAG: 초장시간 비디오 이해 RAG
- MiniRAG: 소형 모델을 위한 경량 RAG