
이미지: Cath Virginia / The Verge
구글이 제미나이 라이브(Gemini Live)에 실시간 영상 기능을 추가하면서 AI 비서와의 상호작용이 한 단계 진화했습니다. 이제 제미나이는 스마트폰 화면이나 카메라를 통해 사용자의 환경을 ‘보고’ 실시간으로 질문에 답변할 수 있게 되었습니다. 이는 인공지능과 인간의 상호작용 방식에 혁명을 가져올 것으로 기대됩니다.
프로젝트 아스트라의 진화
구글이 새롭게 선보인 두 가지 기능은 지난해 Google I/O에서 처음 공개된 ‘프로젝트 아스트라(Project Astra)’를 기반으로 합니다. 이 프로젝트는 AI가 실시간으로 세상을 ‘보고’ 이해하는 기술의 토대를 마련했습니다.
현재 출시된 두 가지 주요 기능은 다음과 같습니다:
- 화면 공유 기능: 사용자는 제미나이에게 스마트폰 화면을 보여주고 화면에 표시된 내용에 대해 질문하거나 도움을 요청할 수 있습니다. 이는 앱 사용 방법을 배우거나 복잡한 정보를 이해하는 데 큰 도움이 될 것입니다.
- 실시간 카메라 기능: 제미나이는 스마트폰 카메라를 통해 사용자의 주변 환경을 실시간으로 분석하고 이에 대한 질문에 답변할 수 있습니다. 예를 들어, 사용자가 도자기에 적합한 페인트 색상을 보여주며 조언을 구하는 등 일상적인 의사결정에 도움을 받을 수 있습니다.
제미나이의 실시간 AI 비디오 기능. 출처: chromeunboxed
사용자 경험의 혁신
이번 기능 추가는 단순한 기술적 업데이트를 넘어 AI 비서와의 상호작용 방식을 근본적으로 변화시킬 것으로 보입니다. 지금까지 AI 비서가 주로 텍스트와 음성 명령을 통해 소통했다면, 이제는 시각적 정보를 실시간으로 처리하고 이해하는 능력을 갖추게 된 것입니다.
Reddit 사용자가 공유한 영상에 따르면, 샤오미 스마트폰에서도 이 기능이 활성화된 것이 확인되었습니다. 이는 이 기능이 픽셀 전용이 아닌 다양한 안드로이드 기기에서 사용 가능함을 시사합니다.
기능 사용 방법도 간단합니다. 제미나이 라이브 인터페이스를 열고 화면 공유나 카메라 기능을 선택한 후, 오른쪽 모서리에 있는 토글 버튼을 탭하기만 하면 됩니다. 이후 제미나이는 실시간으로 화면 또는 카메라 영상을 분석하고 사용자와 상호작용할 수 있습니다.
AI 비서 경쟁에서 선두를 달리는 구글
이번 실시간 영상 기능의 출시는 구글이 AI 비서 시장에서 선두 위치를 공고히 하는 데 큰 역할을 할 것으로 보입니다. 아마존은 알렉사 플러스(Alexa Plus)를 준비 중이고, 애플은 시리(Siri) 업그레이드를 연기한 상황에서, 구글의 이번 혁신은 경쟁 우위를 더욱 강화할 것입니다.
특히 주목할 점은 삼성이 자체 AI 비서인 빅스비(Bixby)를 계속 유지하고 있지만, 최신 삼성 스마트폰에서는 제미나이가 기본 비서로 설정되어 있다는 것입니다. 이는 구글의 AI 기술이 산업 표준으로 자리 잡고 있음을 시사합니다.
제미나이 2.0과 더 넓은 에이전트 시대로의 진화
이번 기능 출시는 구글이 최근 발표한 제미나이 2.0의 비전과도 일맥상통합니다. 제미나이 2.0은 ‘에이전트 시대(agentic era)’를 위해 설계된 모델로, 사용자 주변 세계를 더 잘 이해하고, 여러 단계 앞을 내다보며, 사용자의 감독 하에 행동을 취할 수 있는 능력을 갖추고 있습니다.
구글의 프로젝트 아스트라는 이러한 비전의 일환으로, 다음과 같은 향상된 기능을 제공합니다:
- 개선된 대화: 다양한 언어와 혼합 언어로 대화하며 억양과 일반적이지 않은 단어도 더 잘 이해합니다.
- 새로운 도구 활용: 구글 검색, 렌즈, 지도 등을 사용하여 일상생활에서 더 유용한 보조 역할을 합니다.
- 향상된 메모리: 최대 10분간의 세션 내 메모리를 가지며, 과거 대화를 더 잘 기억해 맞춤형 서비스를 제공합니다.
- 개선된 응답 속도: 새로운 스트리밍 기능과 음성 이해 능력을 통해 인간 대화 수준의 응답 속도를 제공합니다.
미래 전망
구글은 이러한 기능을 Gemini 앱과 같은 구글 제품으로 확장할 계획이며, 안경과 같은 다른 형태의 기기에도 적용할 예정입니다. 특히 일부 신뢰할 수 있는 테스터들은 곧 프로토타입 안경에서 프로젝트 아스트라를 테스트하기 시작할 것입니다.
전문가들은 이 기술이 인간과 AI의 상호작용 방식을 완전히 변화시키고, 더욱 강력한 실시간 AI 시대를 열 수 있다고 전망합니다. 다만 현재로서는 안드로이드 기기에만 제공되는 기능이지만, 구글이 향후 iOS 기기로도 확장할 가능성이 있습니다.
디지털 세상과 물리적 세상의 경계를 허무는 AI
제미나이의 실시간 영상 기능은 디지털 공간과 물리적 공간의 경계를 허물고, AI가 우리 일상에 더 자연스럽게 융합되는 과정을 보여줍니다. 이는 대화형 AI가 단순한 명령 수행을 넘어 우리가 보는 세상을 이해하고 의미 있는 방식으로 상호작용할 수 있는 미래를 예고합니다.
이제 사용자는 복잡한 레시피를 따라 하면서 실시간으로 조언을 구하거나, 낯선 도시에서 건물이나 표지판을 보여주며 정보를 얻거나, 심지어 옷이나 인테리어 선택에 대한 조언까지 AI로부터 받을 수 있게 되었습니다. 기술의 발전이 우리 삶의 방식을 어떻게 바꿀지 지켜보는 것은 매우 흥미로울 것입니다.
결론
구글의 제미나이 라이브 실시간 영상 기능은 인공지능이 우리 일상에 더 깊이 통합되는 중요한 이정표가 될 것입니다. 이 기능은 현재 구글 원 AI 프리미엄 구독자에게 단계적으로 제공되고 있으며, 앞으로 더 많은 사용자가 이 혁신적인 기능을 경험할 수 있게 될 것입니다.
AI 기술이 계속해서 발전함에 따라, 우리는 AI와 더 자연스럽고 직관적으로 상호작용하는 미래를 기대할 수 있습니다. 제미나이의 실시간 영상 기능은 그 미래로 가는 첫 걸음에 불과할지도 모릅니다.
답글 남기기