AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

Agentic Search 팁 – 검색 구현의 세 가지 유형: 리트리벌·하네스·모델

AI 에이전트가 검색을 수행하는 방식은 크게 세 가지로 분류된다. 단순히 “에이전트가 검색한다”는 개념을 넘어, 실제 구현에서 어느 계층에 지능을 두느냐에 따라 시스템 설계가 완전히 달라진다. 검색 엔지니어 Doug Turnbull이 정리한 이 세 가지 유형은 현실적인 구현 선택의 기준을 제공한다.

세 가지 유형 비교

유형지능의 위치핵심 트레이드오프
리트리벌 중심검색 시스템 자체검색 품질에 직접 의존
하네스 중심에이전트 루프(스캐폴딩)비용·속도 vs 유연성
모델 중심검색 특화 파인튜닝 모델초기 투자 크지만 장기적으로 효율

1. 리트리벌 중심 (Retrieval-Centric)

가장 직관적인 접근법이다. 좋은 검색 시스템이 있으면 에이전트는 단순히 그 결과를 사용한다.

작동 방식: 에이전트가 검색 API를 호출하고, 반환된 결과를 컨텍스트로 활용해 답변을 생성한다.

장점:

  • 구현이 단순하다
  • 검색 시스템 개선이 에이전트 성능 향상으로 직결된다

한계:

  • 검색 품질에 직접적으로 의존한다. Google·Bing 수준의 검색을 구축하는 것은 매우 어렵다
  • 리트리벌 자체의 결함(관련 없는 결과, 다양성 부족)이 에이전트 추론을 쉽게 혼란시킨다
  • “더 나은 리트리벌이 오히려 에이전트 성능을 떨어뜨리는” 역설적 현상이 보고됐다

2. 하네스 중심 (Harness-Centric)

에이전트 루프(하네스) 자체가 검색 전략을 결정한다. 에이전트가 여러 검색 도구를 자율적으로 선택·조합해 결과를 개선한다.

작동 방식: 에이전트가 쿼리를 분해하고, 여러 검색 전략을 시도하고, 결과를 평가해 최종 답변을 합성한다.

장점:

  • 검색 실패를 에이전트가 스스로 인식하고 다른 전략으로 전환할 수 있다
  • 다양한 도구(키워드 검색, 벡터 검색, 필터링)를 유연하게 조합한다

한계:

  • 매 새로운 컨텍스트마다 “무엇이 효과적인지” 재학습하는 낭비가 발생한다
  • 느리고 비싸다 — 여러 번의 LLM 호출이 필요하다
  • 같은 실수를 반복하는 경향이 있다

3. 모델 중심 (Model-Centric)

검색 작업에 특화된 모델을 파인튜닝한다. 에이전트가 “어떤 도구를 언제 호출할지”를 모델 가중치로 학습한다.

작동 방식: 에이전트의 추론·도구 호출 경로를 judge가 평가해 레이블링하고, 이를 오픈 웨이트 모델 파인튜닝에 활용한다. 학습된 모델은 특정 검색 도메인에서 즉각적으로 올바른 도구를 호출한다.

장점:

  • 반복적인 실수를 제거한다
  • 검색 도메인에 집중된 작은 모델로 충분하므로 셀프호스팅도 가능하다
  • 시스템 프롬프트만 바꿔도 동작 방식을 조정할 수 있다 (“e-commerce 검색 최적화” vs “금융 리서치 다양성 극대화”)

한계:

  • 아직 초기 단계다. SID, Glean의 Waldo 등 일부 제품이 있지만 광범위하게 채택되지 않았다
  • 학습 데이터 구축과 파인튜닝 비용이 초기에 크다

어떤 유형을 선택할까

  • 빠르게 프로토타입을 만들고 싶다 → 리트리벌 중심으로 시작
  • 다양한 검색 전략이 필요하고 유연성이 중요하다 → 하네스 중심
  • 특정 도메인에서 반복적으로 운용하고 비용·속도가 중요하다 → 모델 중심 고려

실제로는 세 유형을 조합하는 경우가 많다. 하네스가 리트리벌 시스템을 호출하되, 일부 판단은 파인튜닝된 작은 모델에 위임하는 식이다.

관련 문서

  • agentic-search — Agentic Search 개요
  • rag — RAG 기본 개념
  • agent-harness — 에이전트 하네스 엔지니어링 방법론
  • skill-rag — RAG 실패를 진단하고 스킬 라우팅으로 교정하는 프레임워크

참고 자료



AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)