AI Sparkup

복잡한 AI 세상을 읽는 힘 ⚡

ChatGPT 검색의 비밀: 12만 건 데이터와 설정 파일로 밝혀낸 AI 검색의 진실

ChatGPT는 구글에 의존하지 않고 다중 소스와 독자적인 리랭킹 시스템으로 검색 결과를 생성하며, 신선도와 전문성을 우선시하는 복잡한 AI 검색 메커니즘을 통해 콘텐츠를 선별합니다.

ChatGPT가 어떻게 검색하고 어떤 웹사이트를 참조하는지 궁금해본 적 있나요? 많은 사람들이 ChatGPT가 마이크로소프트와의 관계 때문에 Bing을 사용하거나, 혹은 몰래 구글을 사용한다고 추측해왔습니다. 하지만 실제 데이터 분석과 설정 파일 해부를 통해 밝혀진 진실은 예상과 완전히 달랐습니다.

ChatGPT가 구글을 사용하는지 확인하는 실험
출처: Ahrefs

구글 의존설의 진실: 83%가 말해주는 이야기

SEO 도구 회사 Ahrefs가 11만 8,931개의 실제 ChatGPT 검색 쿼리를 분석한 결과는 충격적이었습니다. ChatGPT가 정말로 구글을 몰래 사용하고 있을까요?

결과는 명확했습니다. ChatGPT 검색 결과의 83.39%가 구글 검색 결과에 전혀 나타나지 않았습니다. 만약 ChatGPT가 단순히 구글 검색 결과를 가져온다면, 훨씬 높은 일치율을 보여야 했을 것입니다.

구체적인 수치를 보면:

  • 구글 상위 10개 결과와 일치: 단 6.82%
  • 구글 상위 20개 결과와 일치: 9.85%
  • 구글 검색 결과 전체와 일치: 16.61%

이는 ChatGPT가 구글에만 의존하지 않는다는 강력한 증거입니다. 대신 구글, Bing, 자체 인덱스, 서드파티 검색 API 등 다양한 소스를 조합하는 하이브리드 접근 방식을 사용합니다.

ChatGPT 내부 설정 파일이 밝혀낸 검색 메커니즘

더 흥미로운 발견은 ChatGPT의 실제 프로덕션 환경 설정 파일 분석에서 나왔습니다. 브라우저 개발자 도구에서 소스 코드를 확인하면 ChatGPT가 어떻게 검색하고 순위를 매기는지 알 수 있습니다.

ChatGPT 설정 파일의 리랭킹 설정
ChatGPT 소스 코드에서 발견된 리랭킹 설정

핵심 발견: ret-rr-skysight-v3 리랭킹 모델

ChatGPT는 ‘ret-rr-skysight-v3’라는 정교한 리랭킹 모델을 사용합니다. 이는 단순한 검색 알고리즘이 아닙니다. 초기 검색 결과를 가져온 후, 품질 지표를 바탕으로 완전히 재정렬하는 후처리 시스템입니다.

신선도가 왕: 최신 콘텐츠 우선순위

설정 파일에서 가장 중요한 발견 중 하나는 use_freshness_scoring_profile: true 설정입니다. 이는 ChatGPT가 최신 콘텐츠를 적극적으로 우선순위에 둔다는 의미입니다.

2022년에 작성한 아무리 훌륭한 가이드라도, 더 최신의 콘텐츠에 밀려날 수 있습니다. 정기적인 콘텐츠 업데이트는 이제 선택이 아닌 필수가 되었습니다.

다층 필터링 시스템

설정 파일은 여러 단계의 정교한 필터링 파이프라인을 보여줍니다:

  • 쿼리 의도 감지: enable_query_intent: true로 사용자가 실제로 무엇을 원하는지 분석
  • 소스 필터링: 신뢰할 수 있는 소스를 우선순위로 선별
  • 어휘 검색: 전문 용어를 정확히 사용하는 콘텐츠에 가점 부여
  • MIME 타입 필터링: 적절한 파일 형식의 콘텐츠 선호

콘텐츠 크리에이터를 위한 실무 인사이트

이러한 분석 결과는 콘텐츠 제작자들에게 중요한 시사점을 제공합니다.

1. 업데이트 빈도가 완벽함을 이긴다

신선도 점수 시스템은 항상 켜져 있습니다. 완벽한 콘텐츠도 ChatGPT 눈에는 시간이 지나면 낡아집니다. 정기적인 업데이트가 핵심입니다.

2. 의도 일치가 중요하다

쿼리 의도 감지가 활성화되어 있으므로, 콘텐츠는 제공하는 정보 유형을 명확히 신호해야 합니다. 제품 비교 글은 블로그 포스트처럼 보이면 안 됩니다.

3. 전문 용어가 경쟁력이다

어휘 검색 시스템은 업계 전문 용어의 적절한 사용을 보상합니다. 해당 분야의 정확한 용어를 사용하고 정의하는 사이트가 유리합니다.

4. 다중 에이전트 환경 대비하기

ChatGPT는 개인 연결 소스(구글 드라이브, 드롭박스, 노션 등)에 대해서는 가벼운 점수 시스템을, 공개 웹 콘텐츠에 대해서는 전체 리랭킹과 점수 시스템을 사용합니다.

AI 검색 시대의 새로운 SEO 전략

AI 검색 엔진들이 검색 결과를 압축해서 1-2개 소스만 보여주는 상황에서, 상위 순위 확보는 더욱 중요해졌습니다. 벤포드의 법칙(Benford’s Law)에 따르면, 첫 번째 순위의 콘텐츠가 불균형적으로 많이 참조됩니다.

AI 검색 결과 순위를 위한 기술적 SEO 요소 다이어그램
AI 검색 순위를 위한 기술적 SEO 요소들 (출처: Xponent21)

최적화 체크리스트

  1. 구조화된 데이터 마크업: FAQPage, HowTo, Article 스키마 적극 활용
  2. 명확하고 직접적인 답변: 섹션 시작 부분에 간결한 답변 제시
  3. 모바일 최적화와 페이지 속도: AI 크롤러들이 중시하는 기술적 요소
  4. 전문성과 권위성 구축: E-E-A-T 원칙에 따른 신뢰도 확보
  5. 정기적인 콘텐츠 감사: 오래된 내용 새로고침과 성능 최적화

미래를 준비하는 전략

AI 검색의 급속한 발전에 대비하려면 지속적인 적응이 필요합니다. 2025년 현재 구글 검색의 57%가 AI 오버뷰를 포함하고 있으며, 이 비율은 계속 증가할 것입니다.

ChatGPT가 크롬 확장 프로그램을 통해 기본 검색 엔진으로 자리잡으려 하는 상황에서, 기존 SEO 전략만으로는 부족합니다. AI 친화적인 콘텐츠 제작과 다양한 AI 플랫폼 최적화가 새로운 표준이 되고 있습니다.

이 분석이 보여주는 것은 명확합니다. ChatGPT는 단순히 구글을 베끼는 것이 아니라, 독자적이고 정교한 검색 시스템을 구축했습니다. 콘텐츠 크리에이터들은 이제 구글뿐만 아니라 ChatGPT를 비롯한 다양한 AI 검색 엔진을 염두에 두고 전략을 수립해야 합니다.

AI 검색의 핵심은 사용자 의도를 정확히 파악하고, 신선하고 권위 있는 콘텐츠를 제공하는 것입니다. 기술적 최적화와 함께 지속적인 콘텐츠 업데이트, 전문성 강화가 AI 검색 시대의 성공 열쇠가 될 것입니다.


참고자료:


AI Sparkup 구독하기

구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.

Comments