AI 에이전트가 검색을 건너뛰는 순간, Google·NYU 연구가 발견한 4가지 패턴

2026-06-03

﹒

2 minutes

AI 딥서치 에이전트는 복잡한 질문에 여러 번 검색하며 답을 찾도록 설계됐습니다. 그런데 Google·NYU 연구팀이 이 에이전트를 훈련시키다 보니, 예상과 달리 검색을 건너뛰는 경우가 반복적으로 나타났습니다. 어떤 조건에서 에이전트가 멈추고, 어떤 조건에서 계속 탐색하는지를 처음으로 정량화한 것이 SAGE 논문의 숨겨진 발견입니다.

사진 출처: Search Engine Journal

Google Cloud AI Research와 NYU 연구팀이 2026년 1월 발표한 SAGE(Steerable Agentic Data Generation for Deep Search with Execution Feedback) 논문은, AI 딥서치 에이전트를 훈련하기 위한 고난도 합성 데이터를 자동으로 생성하는 파이프라인을 제안합니다. 핵심 목표는 에이전트가 단순한 질문에 안주하지 않고 진짜 어려운 다단계 추론을 수행하도록 훈련 데이터의 품질을 높이는 것이었습니다. 그 과정에서 연구팀은 에이전트가 복잡한 탐색을 피하는 네 가지 패턴을 발견했습니다.

출처: SAGE: Steerable Agentic Data Generation for Deep Search with Execution Feedback – arXiv (Google Cloud AI Research / NYU)

왜 어려운 훈련 데이터가 필요했나

기존에 AI 에이전트 훈련에 쓰이던 데이터셋(MuSiQue, HotpotQA, Natural Questions 등)은 질문 하나를 풀기 위해 평균 1.3~2.7번의 검색만 필요했습니다. 실제 딥서치 환경에서 에이전트가 수행하는 추론 단계에는 한참 못 미치는 수준입니다.

SAGE는 이 간극을 메우기 위해 이중 에이전트 구조를 채택했습니다. 하나의 AI가 어려운 질문을 생성하면, 다른 AI(서치 에이전트)가 그 질문을 실제로 풀어보며 난이도와 정답 가능성을 피드백합니다. 질문이 너무 쉽게 풀리면 피드백을 바탕으로 더 어렵게 다듬는 과정을 반복합니다. 이 방식으로 훈련한 에이전트는 대표적인 딥서치 벤치마크에서 최대 23% 성능 향상을 기록했습니다.

에이전트가 검색을 건너뛰는 4가지 패턴

훈련 데이터 정제 과정에서 연구팀이 발견한 핵심 인사이트는, 에이전트가 다단계 추론 없이도 답을 찾아버리는 상황이 일정한 패턴을 따른다는 점입니다.

정보 공동 위치 — 하나의 문서 안에 답에 필요한 정보가 이미 다 모여 있을 때. 에이전트는 여러 곳을 뒤질 필요 없이 한 페이지에서 답을 완성합니다. 가장 빈번하게 나타난 지름길 패턴입니다.
다중 쿼리 붕괴 — 하나의 검색어가 여러 단계의 정보를 한꺼번에 돌려줄 때. 에이전트가 여러 번 검색하도록 설계된 질문이라도, 단 한 번의 쿼리로 필요한 정보를 다 얻어버리면 탐색이 조기 종료됩니다.
표면적 복잡성 — 질문은 길고 복잡해 보이지만 검색엔진이 중간 단계를 생략하고 바로 답을 내줄 때. 인간이 보기엔 어렵지만 에이전트가 쉽게 처리해 버리는 케이스입니다.
과도하게 구체적인 질문 — 질문 안에 힌트가 너무 많이 담겨 있어 첫 번째 검색에서 답이 바로 나올 때. 세부 조건이 오히려 답을 노출시키는 역설적인 상황입니다.

이 네 가지는 SAGE가 “훈련 데이터 실패”로 분류하는 패턴이지만, 역설적으로 실제 에이전트가 어떤 정보 구조에서 멈추는지를 가장 잘 보여주는 사례이기도 합니다.

논문이 말하는 것과 말하지 않는 것

SAGE 발표 이후 일부 SEO 관련 글에서는 이 4가지 패턴을 “에이전트 검색 최적화 전략”으로 해석했습니다. 하지만 논문 자체는 그런 주장을 하지 않습니다. SAGE는 어디까지나 훈련 데이터 생성 방법론에 관한 연구이고, 지름길 패턴은 데이터 품질을 저하시키는 요인으로 분석된 것입니다.

다만 이 연구가 흥미로운 이유는 따로 있습니다. AI 에이전트가 실제로 어떤 정보 구조에 반응하는지를 실험적으로 드러낸 첫 번째 정량 연구라는 점입니다. 에이전트가 검색을 몇 번 하는지, 어떤 조건에서 탐색을 멈추는지는 지금까지 블랙박스에 가까웠습니다. SAGE는 그 안을 조금 들여다본 연구입니다.

논문의 나머지 실험 결과, 벤치마크 데이터, 훈련 방법론의 세부 설계는 원문에서 직접 확인할 수 있습니다.

참고자료: Google’s SAGE Agentic AI Research: What It Means For SEO – Search Engine Journal

Like?

AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

AI Sparkup

AI 에이전트가 검색을 건너뛰는 순간, Google·NYU 연구가 발견한 4가지 패턴

왜 어려운 훈련 데이터가 필요했나

에이전트가 검색을 건너뛰는 4가지 패턴

논문이 말하는 것과 말하지 않는 것

AI Sparkup 구독하기

Comments

답글 남기기 응답 취소

More posts

에이전트에게 준 스펙도 유효기간이 있다, 오래 쌓아두면 오히려 헷갈린다

MS 해커톤에서 검증된 AI 에이전트 병렬 작업법, 핵심은 Git 워크트리

AI 탐지기, 문체를 흉내 내자 글 5개 중 1개를 놓쳤다

생산성은 오르고 만족감은 사라지는 이유, 개발자의 보상 회로가 문제였다