AI Sparkup

복잡한 AI 세상을 읽는 힘

Google AI Mode는 어떻게 작동하는가: Query Fan-out부터 개인화까지, 혁신적 검색 엔진의 내부 메커니즘 해부

Google I/O 2025에서 공개된 AI Mode는 단순한 검색 기능의 개선이 아닙니다. 이는 검색의 근본적 패러다임을 바꾸는 기술적 혁신으로, 기존의 ‘키워드 매칭’ 방식에서 ‘지능형 추론’ 방식으로의 전환을 의미합니다. 그렇다면 이러한 혁신적 변화가 어떻게 가능했을까요? AI Mode의 핵심 작동 원리를 기술적 관점에서 자세히 살펴보겠습니다.

핵심 엔진: Query Fan-out 기법의 작동 원리

AI Mode의 가장 혁신적인 기술은 바로 ‘Query Fan-out’ 기법입니다. 이는 하나의 복합적인 질문을 여러 개의 세부 질문으로 분해하여 동시에 처리하는 방식으로, 기존 검색과는 완전히 다른 접근법을 사용합니다.

기존 검색 vs Query Fan-out의 차이

기존의 전통적인 검색에서는 사용자가 “편안한 오버이어 블루투스 헤드폰 추천”이라고 검색하면, 해당 키워드에 맞는 결과를 순차적으로 찾아 제공했습니다. 하지만 Query Fan-out 기법은 이 질문을 다음과 같이 분해합니다:

  • “최고의 오버이어 블루투스 헤드폰”
  • “가장 편안한 오버이어 헤드폰”
  • “배터리 수명이 긴 블루투스 헤드폰”
  • “가격대별 오버이어 헤드폰 비교”
  • “사용자 리뷰가 좋은 블루투스 헤드폰”
  • “Sony vs Bose vs Sennheiser 헤드폰 비교”

이렇게 분해된 각각의 질문들은 동시에 처리되며, Google의 쇼핑 그래프, 지식 그래프, 실시간 웹 데이터 등 다양한 소스에서 정보를 수집합니다. 최종적으로 이 모든 정보를 종합하여 사용자의 원래 질문에 대한 포괄적이고 정확한 답변을 생성하게 됩니다.

Gemini 2.5 커스텀 버전: 검색 특화 AI의 핵심

AI Mode의 두뇌 역할을 하는 것은 검색에 특화된 Gemini 2.5 커스텀 버전입니다. 이는 일반적인 Gemini 2.5와는 다른 특별한 기능들을 갖추고 있습니다.

Deep Think 모드와 향상된 추론 능력

Gemini 2.5 Pro의 Deep Think 모드는 복잡한 질문에 대해 여러 가설을 고려한 후 응답하는 향상된 추론 모드입니다. 이 기능은 2025년 USAMO(미국 수학 올림피아드) 벤치마크에서 인상적인 점수를 기록하고, LiveCodeBench에서 선두를 차지할 정도로 강력한 성능을 보여줍니다.

검색 맥락에서 Deep Think는 사용자의 질문에 담긴 숨겨진 의도를 파악하고, 다양한 관점에서 접근하여 더욱 정확하고 포괄적인 답변을 제공합니다.

멀티모달 처리 능력

Gemini 2.5는 텍스트뿐만 아니라 이미지, 음성, 비디오를 동시에 처리할 수 있는 멀티모달 능력을 갖추고 있습니다. 이는 AI Mode에서 다음과 같은 기능들을 가능하게 합니다:

  • 카메라로 찍은 이미지를 실시간으로 분석하여 관련 정보 제공
  • 음성 질문을 자연스럽게 이해하고 음성으로 응답
  • 동영상 콘텐츠를 분석하여 관련 정보 추출

개인화 시스템: 맞춤형 검색의 구현 방식

AI Mode의 개인화 기능은 단순히 검색 기록만을 활용하는 것이 아닙니다. 사용자의 동의 하에 Gmail, 캘린더, Keep, Tasks, Maps 등 다양한 Google 앱의 데이터를 통합하여 개인 맥락 정보를 활용합니다.

개인 맥락 정보 통합 메커니즘

예를 들어, “이번 주말 친구들과 나쉬빌에서 할 만한 음식점”이라고 검색하면, AI Mode는 다음과 같은 정보들을 종합합니다:

  • Gmail의 항공편 및 호텔 예약 확인서
  • 과거 검색 기록에서 선호하는 음식 유형
  • 캘린더의 일정 정보
  • Maps에서의 위치 검색 패턴

이러한 정보들은 암호화된 상태로 처리되며, 사용자는 언제든지 개인화 기능을 켜거나 끌 수 있는 완전한 제어권을 갖습니다.

출처: Google Blog

Live 기능: Project Astra 기술의 실시간 구현

AI Mode의 Live 기능은 Google DeepMind의 Project Astra 기술을 기반으로 합니다. 이는 실시간으로 카메라를 통해 보는 것을 이해하고 대화할 수 있는 혁신적인 기술입니다.

실시간 멀티모달 처리 과정

Live 기능의 작동 과정은 다음과 같습니다:

  1. 관찰 단계: 카메라로 들어오는 실시간 영상에서 텍스트, 객체, 코드, 이미지 등을 식별하고 이해합니다.
  2. 계획 단계: 사용자의 복잡한 목표를 해석하고 실행 가능한 단계들로 계획을 수립합니다. 이 과정에서 AI는 자신의 의사결정 과정을 명확하게 설명합니다.
  3. 실행 단계: 계획에 따라 실시간으로 정보를 제공하고 사용자와 상호작용하며, 사용자는 언제든지 추가 질문을 하거나 과정을 중단할 수 있습니다.

이는 단순한 정적 이미지 분석을 넘어서, 실시간으로 변화하는 환경을 이해하고 대응할 수 있는 수준에 도달했음을 의미합니다.

에이전틱 기능: Project Mariner의 실제 작업 수행

AI Mode의 가장 혁신적인 부분 중 하나는 실제 작업을 수행할 수 있는 에이전틱 기능입니다. 이는 Google DeepMind의 Project Mariner 기술을 기반으로 합니다.

에이전틱 작업 수행 메커니즘

Project Mariner는 웹 브라우저를 통해 실제 웹사이트를 탐색하고 상호작용할 수 있는 AI 에이전트입니다. AI Mode에서는 이 기술을 활용하여 다음과 같은 작업들을 자동으로 수행할 수 있습니다:

  • 티켓 예약: “이번 토요일 레즈 경기 하부석 저렴한 티켓 2장 찾아줘”라고 요청하면, 여러 티켓 사이트를 동시에 검색하여 실시간 가격과 재고를 분석하고 조건에 맞는 옵션을 제시합니다.
  • 레스토랑 예약: Resy, OpenTable 등의 플랫폼과 연동하여 실제 예약 가능한 시간과 테이블을 확인하고 예약을 진행합니다.
  • 로컬 서비스 예약: Vagaro와 같은 플랫폼을 통해 미용실, 마사지샵 등의 예약을 처리합니다.

외부 서비스 연동과 보안 체계

에이전틱 기능은 Ticketmaster, StubHub, Resy, Vagaro 등의 파트너 서비스들과 안전한 API 연동을 통해 구현됩니다. 중요한 것은 모든 과정에서 사용자가 완전한 제어권을 유지한다는 점입니다:

  • 모든 작업은 사용자의 명시적 승인 하에 진행
  • 실시간으로 진행 상황을 모니터링할 수 있음
  • 언제든지 작업을 중단하고 직접 제어 가능
  • 결제는 Google Pay를 통해 안전하게 처리
출처: Google DeepMind

보안과 개인정보 보호: 향상된 안전장치

AI Mode의 모든 기능은 강화된 보안 체계 위에서 작동합니다. Google은 특히 간접 프롬프트 인젝션 공격(악의적인 지시사항이 AI 모델이 검색하는 데이터에 포함되는 공격)에 대한 보호율을 크게 향상시켰습니다.

다층 보안 시스템

  • AI 모델 레벨 보안: Gemini 2.5 자체에 내장된 보안 필터
  • 데이터 처리 보안: 개인 정보 암호화 및 익명화 처리
  • 외부 연동 보안: 파트너 서비스와의 안전한 API 통신
  • 사용자 제어: 모든 개인화 기능에 대한 사용자 완전 제어

기술적 성능과 효율성

AI Mode는 단순히 기능만 향상된 것이 아니라 성능면에서도 크게 개선되었습니다. 업데이트된 Gemini 2.5 Flash는 다양한 벤치마크에서 성능이 향상되었으면서도 토큰 사용량은 20-30% 감소했습니다.

실시간 처리 능력

AI Mode의 가장 인상적인 부분은 복잡한 Query Fan-out 과정을 거치면서도 Google 검색 수준의 빠른 응답 속도를 유지한다는 점입니다. 이는 다음과 같은 기술적 최적화를 통해 가능해졌습니다:

  • 병렬 처리를 통한 동시 다발적 검색
  • 지능적 캐싱 시스템
  • 효율적인 리소스 할당
  • 최적화된 모델 추론

향후 발전 방향과 한계

현재 AI Mode는 미국에서만 서비스되고 있으며, 일부 고급 기능들은 Google Labs를 통해 테스트 중입니다. 향후 전 세계로 확대될 예정이며, 다음과 같은 발전이 예상됩니다:

기술적 확장 계획

  • 언어 지원 확대: 현재 영어 중심에서 다국어 지원으로 확대
  • 더 많은 서비스 연동: 현재 티켓, 레스토랑, 로컬 서비스에서 더 다양한 영역으로 확장
  • 개선된 개인화: 더 정교한 개인 맥락 이해와 활용
  • 하드웨어 연동: 스마트 글래스 등 새로운 형태의 디바이스 지원

AI Mode의 기술적 혁신은 단순히 검색 기능의 개선을 넘어서, 인공지능이 인간의 디지털 생활에 어떻게 통합될 수 있는지를 보여주는 중요한 이정표입니다. Query Fan-out부터 실시간 멀티모달 처리, 에이전틱 작업 수행까지, 이 모든 기술들이 조화롭게 작동하여 진정한 의미의 ‘지능형 검색’을 구현하고 있습니다.

앞으로 이러한 기술들이 어떻게 발전하고 우리의 일상생활을 어떻게 변화시킬지 지켜보는 것이 흥미로운 시점입니다. 특히 한국어 지원과 국내 서비스 연동이 언제 이루어질지도 주목해야 할 부분입니다.


참고자료:

Comments