Agentic Search 팁 – 검색 구현의 세 가지 유형: 리트리벌·하네스·모델

세 가지 유형 비교
1. 리트리벌 중심 (Retrieval-Centric)
2. 하네스 중심 (Harness-Centric)
3. 모델 중심 (Model-Centric)
어떤 유형을 선택할까
관련 문서
참고 자료

AI 에이전트가 검색을 수행하는 방식은 크게 세 가지로 분류된다. 단순히 “에이전트가 검색한다”는 개념을 넘어, 실제 구현에서 어느 계층에 지능을 두느냐에 따라 시스템 설계가 완전히 달라진다. 검색 엔지니어 Doug Turnbull이 정리한 이 세 가지 유형은 현실적인 구현 선택의 기준을 제공한다.

세 가지 유형 비교

유형	지능의 위치	핵심 트레이드오프
리트리벌 중심	검색 시스템 자체	검색 품질에 직접 의존
하네스 중심	에이전트 루프(스캐폴딩)	비용·속도 vs 유연성
모델 중심	검색 특화 파인튜닝 모델	초기 투자 크지만 장기적으로 효율

1. 리트리벌 중심 (Retrieval-Centric)

가장 직관적인 접근법이다. 좋은 검색 시스템이 있으면 에이전트는 단순히 그 결과를 사용한다.

작동 방식: 에이전트가 검색 API를 호출하고, 반환된 결과를 컨텍스트로 활용해 답변을 생성한다.

장점:

구현이 단순하다
검색 시스템 개선이 에이전트 성능 향상으로 직결된다

한계:

검색 품질에 직접적으로 의존한다. Google·Bing 수준의 검색을 구축하는 것은 매우 어렵다
리트리벌 자체의 결함(관련 없는 결과, 다양성 부족)이 에이전트 추론을 쉽게 혼란시킨다
“더 나은 리트리벌이 오히려 에이전트 성능을 떨어뜨리는” 역설적 현상이 보고됐다

2. 하네스 중심 (Harness-Centric)

에이전트 루프(하네스) 자체가 검색 전략을 결정한다. 에이전트가 여러 검색 도구를 자율적으로 선택·조합해 결과를 개선한다.

작동 방식: 에이전트가 쿼리를 분해하고, 여러 검색 전략을 시도하고, 결과를 평가해 최종 답변을 합성한다.

장점:

검색 실패를 에이전트가 스스로 인식하고 다른 전략으로 전환할 수 있다
다양한 도구(키워드 검색, 벡터 검색, 필터링)를 유연하게 조합한다

한계:

매 새로운 컨텍스트마다 “무엇이 효과적인지” 재학습하는 낭비가 발생한다
느리고 비싸다 — 여러 번의 LLM 호출이 필요하다
같은 실수를 반복하는 경향이 있다

3. 모델 중심 (Model-Centric)

검색 작업에 특화된 모델을 파인튜닝한다. 에이전트가 “어떤 도구를 언제 호출할지”를 모델 가중치로 학습한다.

작동 방식: 에이전트의 추론·도구 호출 경로를 judge가 평가해 레이블링하고, 이를 오픈 웨이트 모델 파인튜닝에 활용한다. 학습된 모델은 특정 검색 도메인에서 즉각적으로 올바른 도구를 호출한다.

장점:

반복적인 실수를 제거한다
검색 도메인에 집중된 작은 모델로 충분하므로 셀프호스팅도 가능하다
시스템 프롬프트만 바꿔도 동작 방식을 조정할 수 있다 (“e-commerce 검색 최적화” vs “금융 리서치 다양성 극대화”)

한계:

아직 초기 단계다. SID, Glean의 Waldo 등 일부 제품이 있지만 광범위하게 채택되지 않았다
학습 데이터 구축과 파인튜닝 비용이 초기에 크다

어떤 유형을 선택할까

빠르게 프로토타입을 만들고 싶다 → 리트리벌 중심으로 시작
다양한 검색 전략이 필요하고 유연성이 중요하다 → 하네스 중심
특정 도메인에서 반복적으로 운용하고 비용·속도가 중요하다 → 모델 중심 고려

실제로는 세 유형을 조합하는 경우가 많다. 하네스가 리트리벌 시스템을 호출하되, 일부 판단은 파인튜닝된 작은 모델에 위임하는 식이다.

참고 자료

Agentic search – retrieval, harness, or model? — Doug Turnbull, softwaredoug.com (2026-06-08)

Like?

AI Sparkup