Skill-RAG – RAG 실패 상태를 진단하고 스킬 라우팅으로 정렬 오류를 교정하는 프레임워크

배경 문제
핵심 아이디어
파이프라인 흐름
성능
의의
논문 정보
관련 문서

Skill-RAG는 RAG(검색 증강 생성) 파이프라인에서 검색 실패를 단순히 재시도하는 대신 원인을 진단하고 적절한 스킬로 교정하는 실패 인식 프레임워크다. 2026년 4월 arXiv에 공개된 논문(arXiv:2604.15771)에서 제안되었으며, 오픈 도메인 QA와 복잡한 추론 벤치마크에서 기존 적응형 RAG 대비 유의미한 정확도 향상을 보였다.

배경 문제

기존 적응형 RAG는 검색 후 생성 품질이 낮으면 단순 재시도한다. 하지만 많은 검색 실패가 “관련 증거 없음”이 아니라 쿼리-증거 공간 불일치(query-evidence misalignment) 때문에 발생한다. 즉, 증거는 있지만 쿼리와 표현 방식이 달라 검색기가 찾지 못하는 경우다.

핵심 아이디어

Skill-RAG는 두 가지 핵심 컴포넌트로 구성된다:

숨겨진 상태 프로버(Hidden-State Prober): LLM 내부의 은닉 상태를 분석해 현재 생성이 실패 상태인지 두 단계에서 감지한다. 외부 판단 모델 없이 경량으로 작동한다.

스킬 라우터(Skill Router): 실패 상태 감지 시 원인을 진단하고 다음 네 가지 스킬 중 하나를 선택한다:

스킬	역할
쿼리 재작성(Query Rewriting)	원래 쿼리를 증거 공간에 맞게 표현 변환
질문 분해(Question Decomposition)	복잡한 질문을 단계적인 서브 쿼리로 분해
증거 집중(Evidence Focusing)	검색된 긴 문서에서 핵심 증거 구간을 강조
종료 스킬(Exit Skill)	진정으로 관련 증거가 없는 경우 루프 종료

파이프라인 흐름

쿼리 입력
    │
    ▼
[검색 단계 1] ← 프로버가 실패 감지?
    │                    │ 예
    │            [스킬 라우터: 원인 진단]
    │                    │
    │         쿼리 재작성 / 질문 분해 /
    │         증거 집중 / 종료 스킬 선택
    │                    │
    ▼◄──────────────────┘
[검색 단계 2] ← 프로버가 실패 감지?
    │                    │ 예 → 스킬 재선택
    ▼
[최종 생성]

성능

멀티턴 검색 후에도 어려운 케이스에서 정확도가 크게 향상했으며, 특히 분포 외(out-of-distribution) 데이터셋에서 강한 일반화 성능을 보였다. 표현 공간 분석에서 네 가지 스킬이 실패 상태 공간에서 구조화된 분리 가능 영역을 점유한다는 것을 확인했다 — 쿼리-증거 불일치가 단일 현상이 아닌 유형화된 현상임을 시사한다.

의의

기존 RAG 개선 방식(단순 재시도)의 근본 한계를 지적
경량 은닉 상태 프로빙으로 외부 판단 모델 없이 실패 감지
실패의 원인을 타입별로 분류해 대응 → 더 효율적인 컨텍스트 사용

논문 정보

제목: Skill-RAG: Failure-State-Aware Retrieval Augmentation via Hidden-State Probing and Skill Routing
저자: Kai Wei, Raymond Li, Xi Zhu, Zhaoqian Xue, Jiaojiao Han, Jingcheng Niu, Fan Yang
arXiv: 2604.15771 (2026년 4월)

AI Sparkup

Skill-RAG – RAG 실패 상태를 진단하고 스킬 라우팅으로 정렬 오류를 교정하는 프레임워크

배경 문제

핵심 아이디어

파이프라인 흐름

성능

의의

논문 정보

관련 문서

AI Sparkup 구독하기