AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

전화 목소리가 AI인지 모를 수 있다, Gemini 3.1 Flash Live의 등장

고객센터에 전화했을 때, 상대방이 사람인지 AI인지 확신하기 어렵다면 어떨까요? Google은 3월 26일 새 음성 AI 모델 Gemini 3.1 Flash Live를 공개하며, 바로 그 경계를 다시 그었습니다. 성능 지표에서도 사람과의 구별이 어려워질 만큼 자연스러운 대화가 가능해졌고, 동시에 Google은 워터마크 기술로 그 책임에도 응답했습니다.

사진 출처: Google Blog

Google이 실시간 대화 AI 모델 Gemini 3.1 Flash Live를 공개했습니다. 이전 세대보다 더 빠르고, 감정 인식 능력이 향상됐으며, 복잡한 음성 명령도 더 안정적으로 처리합니다. 이 모델은 현재 Gemini Live, Search Live, Gemini API, Google AI Studio를 통해 사용할 수 있으며, 200개국 이상에서 서비스됩니다.

출처: Gemini 3.1 Flash Live: Google’s latest AI audio model – Google Blog

더 빠르고, 더 자연스럽게

Gemini 3.1 Flash Live의 가장 두드러진 변화는 대화의 자연스러움입니다. 음성 모델은 단순히 말을 텍스트로 바꾸는 것이 아니라, 상대방의 감정 상태를 읽어야 합니다. 이 모델은 목소리의 높낮이(pitch)와 속도(pace)를 이전 세대보다 더 잘 감지하고, 사용자가 당혹감이나 불만을 표현할 때 그에 맞게 응답 방식을 동적으로 조정합니다.

응답 속도도 크게 개선됐습니다. 개발자가 설정할 수 있는 “Minimal” 모드에서는 응답 시간이 0.96초까지 내려가고, 보다 정확한 추론이 필요한 “High” 모드에서는 2.98초입니다. Gemini Live에서는 이전 모델 대비 더 빠른 응답과 함께, 대화 맥락을 2배 더 길게 유지할 수 있게 됐습니다.

벤치마크 성적도 눈에 띕니다. Big Bench Audio 기준 95.9%(High 모드)로 주요 실시간 음성 모델 중 2위에 올랐고, 소음 환경과 중단·망설임이 섞인 실제 대화를 테스트하는 Scale AI의 Audio MultiChallenge에서는 36.1%로 실시간 음성 모델 중 1위를 기록했습니다.

개발자와 기업을 위한 음성 에이전트

이 모델은 소비자용에만 그치지 않습니다. Gemini API와 Google AI Studio를 통해 개발자가 직접 활용할 수 있고, 기업용으로는 Gemini Enterprise for Customer Experience에 탑재되어 고객 응대 자동화에 쓰입니다.

Google은 Verizon, The Home Depot, LiveKit 등과 파트너십을 맺고 실제 업무 환경에서 테스트를 진행했습니다. 복잡한 다단계 함수 호출 능력을 측정하는 ComplexFuncBench Audio에서는 이전 모델 대비 크게 향상된 90.8%를 기록했는데, 이는 실제 고객 응대처럼 여러 단계를 거치는 복잡한 작업에서 더 안정적으로 작동한다는 뜻입니다.

사람 목소리와의 경계, 그리고 SynthID

Ars Technica는 이번 모델의 등장을 “AI인지 모르고 통화하게 될 수도 있다”는 각도로 조명했습니다. 실제로 Google과 파트너 기업들은 3.1 Flash Live가 인간 목소리를 얼마나 자연스럽게 흉내 내는지를 주요 성과로 내세우고 있습니다.

Google은 이에 대한 대응으로 SynthID 워터마크를 탑재했습니다. 모델이 생성하는 모든 음성 출력에 청취자가 들을 수 없는 방식으로 워터마크가 삽입되어, AI가 생성한 콘텐츠임을 기술적으로 탐지할 수 있습니다. 다만 전화 통화 중 상대방이 실시간으로 이를 확인할 방법은 없다는 점에서, 워터마크는 사후 검증 수단에 가깝습니다.

가격은 이전 세대(Gemini 2.5 Flash Native Audio)와 동일하게 오디오 입력 시간당 $0.35, 출력 시간당 $1.40으로 책정됐습니다.

음성 AI가 사람 목소리와 구별하기 어려워지는 시점에, Google은 성능과 안전 장치를 동시에 내놓았습니다. 기술의 성숙과 신뢰 문제가 나란히 떠오른 순간입니다. 모델의 기술 사양과 벤치마크 상세 결과는 Google의 모델 카드에서 확인할 수 있습니다.

참고자료:


AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

Comments

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다