Skill-RAG는 RAG(검색 증강 생성) 파이프라인에서 검색 실패를 단순히 재시도하는 대신 원인을 진단하고 적절한 스킬로 교정하는 실패 인식 프레임워크다. 2026년 4월 arXiv에 공개된 논문(arXiv:2604.15771)에서 제안되었으며, 오픈 도메인 QA와 복잡한 추론 벤치마크에서 기존 적응형 RAG 대비 유의미한 정확도 향상을 보였다.
배경 문제
기존 적응형 RAG는 검색 후 생성 품질이 낮으면 단순 재시도한다. 하지만 많은 검색 실패가 “관련 증거 없음”이 아니라 쿼리-증거 공간 불일치(query-evidence misalignment) 때문에 발생한다. 즉, 증거는 있지만 쿼리와 표현 방식이 달라 검색기가 찾지 못하는 경우다.
핵심 아이디어
Skill-RAG는 두 가지 핵심 컴포넌트로 구성된다:
- 숨겨진 상태 프로버(Hidden-State Prober): LLM 내부의 은닉 상태를 분석해 현재 생성이 실패 상태인지 두 단계에서 감지한다. 외부 판단 모델 없이 경량으로 작동한다.
- 스킬 라우터(Skill Router): 실패 상태 감지 시 원인을 진단하고 다음 네 가지 스킬 중 하나를 선택한다:
| 스킬 | 역할 |
|---|---|
| 쿼리 재작성(Query Rewriting) | 원래 쿼리를 증거 공간에 맞게 표현 변환 |
| 질문 분해(Question Decomposition) | 복잡한 질문을 단계적인 서브 쿼리로 분해 |
| 증거 집중(Evidence Focusing) | 검색된 긴 문서에서 핵심 증거 구간을 강조 |
| 종료 스킬(Exit Skill) | 진정으로 관련 증거가 없는 경우 루프 종료 |
파이프라인 흐름
쿼리 입력
│
▼
[검색 단계 1] ← 프로버가 실패 감지?
│ │ 예
│ [스킬 라우터: 원인 진단]
│ │
│ 쿼리 재작성 / 질문 분해 /
│ 증거 집중 / 종료 스킬 선택
│ │
▼◄──────────────────┘
[검색 단계 2] ← 프로버가 실패 감지?
│ │ 예 → 스킬 재선택
▼
[최종 생성]성능
멀티턴 검색 후에도 어려운 케이스에서 정확도가 크게 향상했으며, 특히 분포 외(out-of-distribution) 데이터셋에서 강한 일반화 성능을 보였다. 표현 공간 분석에서 네 가지 스킬이 실패 상태 공간에서 구조화된 분리 가능 영역을 점유한다는 것을 확인했다 — 쿼리-증거 불일치가 단일 현상이 아닌 유형화된 현상임을 시사한다.
의의
- 기존 RAG 개선 방식(단순 재시도)의 근본 한계를 지적
- 경량 은닉 상태 프로빙으로 외부 판단 모델 없이 실패 감지
- 실패의 원인을 타입별로 분류해 대응 → 더 효율적인 컨텍스트 사용
논문 정보
- 제목: Skill-RAG: Failure-State-Aware Retrieval Augmentation via Hidden-State Probing and Skill Routing
- 저자: Kai Wei, Raymond Li, Xi Zhu, Zhaoqian Xue, Jiaojiao Han, Jingcheng Niu, Fan Yang
- arXiv: 2604.15771 (2026년 4월)
관련 문서
- rag — RAG 기술 전반 개요
- rag-tips-long-context — 장문 컨텍스트 RAG 효율화 기법
- zero-shot-classification — 별도 학습 없이 텍스트를 분류하는 NLP 기법
- inference-caching — LLM 추론 비용 절감 캐시 전략