음성AI
전화 목소리가 AI인지 모를 수 있다, Gemini 3.1 Flash Live의 등장
Google이 공개한 Gemini 3.1 Flash Live는 사람 목소리와 구별하기 어려운 수준의 실시간 음성 AI 모델입니다. 성능, 속도, 그리고 SynthID 워터마크까지 소개합니다.
Written by

구글 AI가 매장에 직접 전화를 건다: Agentic Calling 기능 등장
구글이 미국에서 AI가 직접 매장에 전화해 재고와 가격을 확인해주는 Agentic Calling 기능을 출시했습니다. 행동하는 AI의 실용적 사례를 소개합니다.
Written by

음성 AI, 스타트업의 새로운 골드러시 – YC 클래스 22%가 선택한 이유
음성 AI 시장의 폭발적 성장과 구체적인 비즈니스 기회를 분석하고, 스타트업이 실제로 진입할 수 있는 방법을 제시하는 실용 가이드
Written by

Mistral Voxtral: 음성 AI의 게임체인저가 된 오픈소스 모델
프랑스 AI 스타트업 Mistral이 공개한 첫 오픈소스 음성 AI 모델 Voxtral의 특징과 활용법을 소개합니다. 기존 솔루션 대비 절반 가격으로 더 나은 성능을 제공하는 Voxtral로 음성 AI 접근성이 크게 개선되었습니다.
Written by

아마존 Nova Sonic: AI 음성 기술의 새로운 지평을 열다
아마존이 발표한 Nova Sonic 음성 AI 모델의 혁신적 기술과 특징을 소개합니다. 기존 음성 AI의 한계를 넘어 음성의 뉘앙스를 이해하고 자연스러운 대화가 가능한 이 기술이 다양한 산업에 가져올 변화와 미래 전망을 알아봅니다.
Written by

OpenAI Agents SDK로 구현하는 AI 오디오 투어 가이드 만들기
OpenAI의 Agents SDK와 GPT-4o-mini TTS를 활용하여 위치, 관심사, 투어 시간에 따라 맞춤형 오디오 투어를 생성하는 AI 애플리케이션을 구축하는 방법을 단계별로 알아봅니다. 다중 에이전트 아키텍처로 역사, 건축, 문화, 요리 등 다양한 주제의 콘텐츠를 결합하여 자연스러운 음성으로 전달하는 투어 가이드를 만들어보세요.
Written by
