AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

Skill-RAG – RAG 실패 상태를 진단하고 스킬 라우팅으로 정렬 오류를 교정하는 프레임워크

Skill-RAG는 RAG(검색 증강 생성) 파이프라인에서 검색 실패를 단순히 재시도하는 대신 원인을 진단하고 적절한 스킬로 교정하는 실패 인식 프레임워크다. 2026년 4월 arXiv에 공개된 논문(arXiv:2604.15771)에서 제안되었으며, 오픈 도메인 QA와 복잡한 추론 벤치마크에서 기존 적응형 RAG 대비 유의미한 정확도 향상을 보였다.

배경 문제

기존 적응형 RAG는 검색 후 생성 품질이 낮으면 단순 재시도한다. 하지만 많은 검색 실패가 “관련 증거 없음”이 아니라 쿼리-증거 공간 불일치(query-evidence misalignment) 때문에 발생한다. 즉, 증거는 있지만 쿼리와 표현 방식이 달라 검색기가 찾지 못하는 경우다.

핵심 아이디어

Skill-RAG는 두 가지 핵심 컴포넌트로 구성된다:

  1. 숨겨진 상태 프로버(Hidden-State Prober): LLM 내부의 은닉 상태를 분석해 현재 생성이 실패 상태인지 두 단계에서 감지한다. 외부 판단 모델 없이 경량으로 작동한다.
  1. 스킬 라우터(Skill Router): 실패 상태 감지 시 원인을 진단하고 다음 네 가지 스킬 중 하나를 선택한다:
스킬역할
쿼리 재작성(Query Rewriting)원래 쿼리를 증거 공간에 맞게 표현 변환
질문 분해(Question Decomposition)복잡한 질문을 단계적인 서브 쿼리로 분해
증거 집중(Evidence Focusing)검색된 긴 문서에서 핵심 증거 구간을 강조
종료 스킬(Exit Skill)진정으로 관련 증거가 없는 경우 루프 종료

파이프라인 흐름

쿼리 입력
    │
    ▼
[검색 단계 1] ← 프로버가 실패 감지?
    │                    │ 예
    │            [스킬 라우터: 원인 진단]
    │                    │
    │         쿼리 재작성 / 질문 분해 /
    │         증거 집중 / 종료 스킬 선택
    │                    │
    ▼◄──────────────────┘
[검색 단계 2] ← 프로버가 실패 감지?
    │                    │ 예 → 스킬 재선택
    ▼
[최종 생성]

성능

멀티턴 검색 후에도 어려운 케이스에서 정확도가 크게 향상했으며, 특히 분포 외(out-of-distribution) 데이터셋에서 강한 일반화 성능을 보였다. 표현 공간 분석에서 네 가지 스킬이 실패 상태 공간에서 구조화된 분리 가능 영역을 점유한다는 것을 확인했다 — 쿼리-증거 불일치가 단일 현상이 아닌 유형화된 현상임을 시사한다.

의의

  • 기존 RAG 개선 방식(단순 재시도)의 근본 한계를 지적
  • 경량 은닉 상태 프로빙으로 외부 판단 모델 없이 실패 감지
  • 실패의 원인을 타입별로 분류해 대응 → 더 효율적인 컨텍스트 사용

논문 정보

  • 제목: Skill-RAG: Failure-State-Aware Retrieval Augmentation via Hidden-State Probing and Skill Routing
  • 저자: Kai Wei, Raymond Li, Xi Zhu, Zhaoqian Xue, Jiaojiao Han, Jingcheng Niu, Fan Yang
  • arXiv: 2604.15771 (2026년 4월)

관련 문서


AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)