AI Sparkup

복잡한 AI 세상을 읽는 힘 ⚡

구글 12.5만 노출 뒤에 숨은 비밀: AI가 뉴스를 검색하는 방식

ChatGPT나 Claude 같은 AI가 웹에서 정보를 찾을 때, 사람처럼 검색할까요? SEO 전문가 Metehan Ozyurek이 자신의 블로그 글이 구글에서 12.5만 회 노출된 현상을 분석하다가 흥미로운 사실을 발견했습니다. 일반 사용자가 아닌 AI 시스템 자체가 만들어내는 검색 패턴이 Google Search Console에 포착된 겁니다.

사진 출처: metehan.ai

SEO 전문가 Metehan Ozyurek이 자신의 블로그에서 LLM의 최신성 편향(recency bias) 연구를 다룬 글을 발표한 후, Google Search Console에서 특이한 검색 쿼리 패턴을 발견했습니다. 일반적인 사용자 검색과 달리 매우 구체적이고 토픽 중심적이며, 반복 빈도가 비정상적으로 높은 검색어들이 나타났고, 저자는 이것이 LLM이 정보를 탐색하고 검증하는 방식이라고 분석했습니다.

출처: How I Accidentally Triggered 125K Google Impressions Through LLM “AI News Today Recency” Bias – metehan.ai

사람이 아닌 AI가 만드는 검색 패턴

Metehan이 발견한 검색 쿼리들은 일반적인 검색과 명확하게 구분됩니다. 예를 들어 사람은 “AI 뉴스”라고 짧게 검색하지만, LLM은 “최신 AI 발전 동향과 영향에 관한 포괄적 분석”처럼 훨씬 더 구체적이고 완전한 문장 형태로 검색합니다. 게다가 같은 쿼리가 예상보다 훨씬 자주 반복되었죠.

더 흥미로운 점은 이런 검색어들이 최근 AI 논의와 의미적으로 정렬되어 있다는 겁니다. 단순히 키워드를 매칭하는 게 아니라, 주제의 맥락을 이해하고 관련된 최신 정보를 찾으려는 패턴이 보였습니다. 마치 “이 주제에 대한 최신 권위 있는 문서가 있나요?”라고 확인하는 것처럼 말이죠.

Metehan은 이런 행동이 MS MARCO 같은 대규모 학습 데이터셋과 관련이 있을 수 있다고 추측합니다. MS MARCO는 검색 및 질의응답 시스템을 학습시키는 데 업계에서 광범위하게 사용되는 데이터셋인데, 구조적으로 짧은 키워드보다 자연어 질문을 선호하고, 탐색 의도보다 토픽 중심 탐색을 강조하며, 관련성과 최신성을 평가하기 위해 비슷한 질문을 반복하는 특징이 있습니다.

LLM이 정보 검색 시스템과 상호작용할 때 사용하는 ‘멘탈 모델’이 여전히 학습 및 평가 방식의 영향을 받고 있다는 뜻입니다. 실제로 Hugging Face에서 MS MARCO 관련 모델을 검색하면 수백만 건의 다운로드를 기록한 모델들을 확인할 수 있습니다.

새로운 최적화 영역의 등장

더 놀라운 건 일부 웹사이트들이 이미 이런 LLM 스타일 쿼리를 파악하고 타겟팅하고 있다는 사실입니다. Metehan은 특히 “최신 AI 뉴스” 같은 쿼리에서 로이터 같은 전통적 언론사보다 상대적으로 덜 알려진 새로운 웹사이트들이 더 많이 노출되는 현상을 발견했습니다.

저자는 이것이 반드시 스팸을 의미하는 건 아니라고 강조합니다. AI 시스템이 정보를 어떻게 소비하고, 업데이트하고, 검증하는지 이해하는 것은 키워드 조작과는 다른 차원이죠. AI 시스템이 정보를 검증하고 최신 자료를 찾을 때 자연스럽게 발견될 수 있는 위치에 있는 것이니까요.

다만 통찰 기반 최적화와 저품질 AI 생성 콘텐츠 사이의 경계는 생각보다 얇습니다. 실제로 ChatGPT에서 “최신 AI 뉴스” 쿼리로 많은 인용을 받는 일부 페이지를 확인해보면, 콘텐츠 품질에 의문이 들 때도 있습니다.

책임감 있는 접근

Metehan은 자신의 발견을 공유하면서도 명확한 선을 긋습니다. AI 슬롭(대량 생성된 저품질 콘텐츠)이나 합성 스팸 페이지, LLM 행동을 악용하기 위해 대량 생산된 콘텐츠는 지지하지 않는다고 분명히 밝혔죠. 그래서 일반화된 쿼리 목록을 공개하지 않고, “AI News Recency”라는 단일 주제에 대한 자신의 Google Search Console 데이터만 투명하게 공개했습니다.

공개된 데이터는 구글 스프레드시트로 확인할 수 있습니다.

이 데이터를 공개한 이유는 세 가지입니다. 주제가 좁고 명확하며, 의도가 정보 제공적이지 착취적이지 않고, 스팸 전술 없이도 최신성 중심의 AI 주제가 어떻게 가시성을 높일 수 있는지 명확하게 보여주기 때문입니다.

SEO를 넘어 AEO로

이 발견이 제기하는 더 큰 질문은 SEO(검색엔진 최적화), AEO(AI 엔진 최적화), AI 검색 최적화의 미래입니다. 만약 LLM이 MS MARCO 같은 학습 데이터셋의 영향을 받고 최신성 민감한 검색 시스템에 의해 강화된 자체적인 정보 탐색 패턴을 만들어낸다면, AI 주도 정보 수요를 이해하는 것이 인간 의도를 이해하는 것만큼 중요해집니다.

Metehan은 이것을 악용하자는 게 아니라, 책임감 있게 조율하자는 메시지를 전합니다. 그리고 바로 거기에 진짜 기회가 있다고 말하죠. AI가 웹을 탐색하는 방식은 이미 현실입니다. 이제 우리는 그 패턴을 이해하고, 품질을 유지하면서도 AI 시스템에 더 잘 발견될 수 있는 방법을 찾아야 합니다.

참고자료:


AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

Comments

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다