AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

LightRAG – 지식 그래프 기반의 빠르고 단순한 RAG 시스템

기존 RAG(Retrieval-Augmented Generation) 시스템은 문서를 청크(chunk)로 잘라 벡터 검색으로 관련 조각을 찾는 방식이다. 특정 사실을 찾는 데는 효과적이지만, 여러 개념 간의 관계나 전체 맥락을 이어야 하는 질문에는 한계가 있다. LightRAG는 홍콩대학교 데이터과학 연구팀(HKUDS)이 개발해 EMNLP 2025에 발표한 그래프 기반 RAG 시스템으로, 인덱싱 단계에서 LLM이 문서로부터 엔티티(entity)와 관계(relation)를 추출해 지식 그래프(knowledge graph)를 구성한다. 이를 통해 단순 벡터 검색보다 풍부하고 맥락적인 답변을 생성할 수 있다. GitHub ★33.3K, Forks 4.7K.

GitHub: https://github.com/HKUDS/LightRAG 논문: https://arxiv.org/abs/2410.05779

누구에게 유용한가?

  • 지식 집약적인 문서 Q&A가 필요한 개발자: 법률 문서, 기술 매뉴얼, 연구 논문처럼 개념 간 관계가 중요한 문서에서 맥락 있는 검색이 필요할 때
  • 사내 지식 베이스를 구축하는 팀: 방대한 내부 문서에 대해 AI가 구조화된 이해를 기반으로 답변하길 원할 때
  • RAG 시스템을 연구하는 개발자·연구자: 그래프 기반 RAG의 이론과 구현을 탐구할 때

기존 RAG와의 차이

항목기존 벡터 RAGLightRAG
인덱스 구조청크 벡터지식 그래프 + 벡터
관계 이해없음엔티티-관계 그래프
검색 방식유사도 검색로컬/글로벌/하이브리드
맥락 연결제한적개념 수준 연결 가능
LLM 요구 수준낮음높음 (32B+ 권장)

쿼리 모드

LightRAG는 다섯 가지 쿼리 모드를 지원한다.

모드설명적합한 상황
naive기본 벡터 검색단순한 사실 검색
local엔티티 중심 그래프 탐색특정 사실·세부사항
global개념 수준 그래프 탐색전체 맥락·주제 이해
hybridlocal + global 조합복합적인 질문
mixReranker 활용 조합권장 기본값

LLM 및 임베딩 요구사항

LightRAG는 인덱싱 단계에서 LLM이 엔티티-관계를 추출하므로, 일반 RAG보다 모델 품질 요구가 높다.

  • LLM: 최소 32B 파라미터 권장, 컨텍스트 길이 32KB 이상 (64KB 권장)
  • 임베딩: 고성능 다국어 모델 권장 — BAAI/bge-m3, text-embedding-3-large
  • Reranker: BAAI/bge-reranker-v2-m3 등 (mix 모드 성능 대폭 향상)
  • 주의: 임베딩 모델은 인덱싱 전에 결정하고 쿼리 시에도 동일 모델을 사용해야 한다. 변경 시 벡터 테이블 재생성 필요.

주요 기능

  • Web UI: 문서 인덱싱, 지식 그래프 시각화, 쿼리 인터페이스
  • Ollama 호환 인터페이스: Open WebUI 등에서 채팅 모델로 사용 가능
  • 인용 지원: 출처 표시 및 문서 추적성
  • 멀티모달 지원: RAG-Anything 통합으로 PDF·이미지·Office 문서·표·수식 처리
  • 다양한 스토리지 백엔드: PostgreSQL, MongoDB, Neo4j, Redis, OpenSearch 등

설치

권장: Web UI + API 서버

uv tool install "lightrag-hku[api]"
lightrag-server

Docker Compose

git clone https://github.com/HKUDS/LightRAG.git
cd LightRAG
cp env.example .env
docker compose up

코어만 사용 (Python)

pip install lightrag-hku
import os
os.environ["OPENAI_API_KEY"] = "sk-..."
# examples/lightrag_openai_demo.py 참고

라이선스

MIT 라이선스로 공개되어 있어 학술 및 상업적 목적으로 자유롭게 사용, 수정, 배포할 수 있다.

관련 문서

관련 HKUDS 프로젝트:

  • RAG-Anything: 멀티모달 올인원 RAG 시스템
  • VideoRAG: 초장시간 비디오 이해 RAG
  • MiniRAG: 소형 모델을 위한 경량 RAG

관련 자료


AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)