음성AI

2026-07-10
GPT-Live, 말 끝나길 기다리지 않는 ChatGPT 음성모드
AI 트렌드 분석
OpenAI의 새 음성모델 GPT-Live는 말이 끝나길 기다리지 않고 실시간으로 끼어들고 반응합니다. 기존 턴제 방식의 한계를 어떻게 풀었는지 소개합니다.
Written by
Spark
2026-05-14
Thinking Machines 인터랙션 모델, AI와 대화하는 방식을 바꾸는 새로운 접근
AI 트렌드 분석
Thinking Machines Lab의 인터랙션 모델 발표. 턴 방식 AI의 협업 병목을 해결하는 마이크로 턴 기반 실시간 멀티모달 구조를 소개합니다.
Written by
Spark
2026-05-10
GPT-Realtime-2, 실시간 음성에 GPT-5급 추론 결합한 OpenAI 신모델 3종
AI 트렌드 분석
OpenAI가 GPT-5급 추론을 탑재한 실시간 음성 모델 GPT-Realtime-2와 번역·전사 모델을 API로 출시. 음성이 단순 입력을 넘어 추론·행동하는 인터페이스로 진화합니다.
Written by
Spark
2026-03-31
전화 목소리가 AI인지 모를 수 있다, Gemini 3.1 Flash Live의 등장
AI 트렌드 분석
Google이 공개한 Gemini 3.1 Flash Live는 사람 목소리와 구별하기 어려운 수준의 실시간 음성 AI 모델입니다. 성능, 속도, 그리고 SynthID 워터마크까지 소개합니다.
Written by
Spark
2025-12-01
구글 AI가 매장에 직접 전화를 건다: Agentic Calling 기능 등장
AI 트렌드 분석
구글이 미국에서 AI가 직접 매장에 전화해 재고와 가격을 확인해주는 Agentic Calling 기능을 출시했습니다. 행동하는 AI의 실용적 사례를 소개합니다.
Written by
Spark
2025-09-01
음성 AI, 스타트업의 새로운 골드러시 – YC 클래스 22%가 선택한 이유
AI 트렌드 분석
음성 AI 시장의 폭발적 성장과 구체적인 비즈니스 기회를 분석하고, 스타트업이 실제로 진입할 수 있는 방법을 제시하는 실용 가이드
Written by
Spark
2025-07-17
Mistral Voxtral: 음성 AI의 게임체인저가 된 오픈소스 모델
AI 트렌드 분석
프랑스 AI 스타트업 Mistral이 공개한 첫 오픈소스 음성 AI 모델 Voxtral의 특징과 활용법을 소개합니다. 기존 솔루션 대비 절반 가격으로 더 나은 성능을 제공하는 Voxtral로 음성 AI 접근성이 크게 개선되었습니다.
Written by
Spark
2025-04-27
아마존 Nova Sonic: AI 음성 기술의 새로운 지평을 열다
AI 트렌드 분석
아마존이 발표한 Nova Sonic 음성 AI 모델의 혁신적 기술과 특징을 소개합니다. 기존 음성 AI의 한계를 넘어 음성의 뉘앙스를 이해하고 자연스러운 대화가 가능한 이 기술이 다양한 산업에 가져올 변화와 미래 전망을 알아봅니다.
Written by
Spark
2025-03-29
OpenAI Agents SDK로 구현하는 AI 오디오 투어 가이드 만들기
AI 개발 가이드
OpenAI의 Agents SDK와 GPT-4o-mini TTS를 활용하여 위치, 관심사, 투어 시간에 따라 맞춤형 오디오 투어를 생성하는 AI 애플리케이션을 구축하는 방법을 단계별로 알아봅니다. 다중 에이전트 아키텍처로 역사, 건축, 문화, 요리 등 다양한 주제의 콘텐츠를 결합하여 자연스러운 음성으로 전달하는 투어 가이드를 만들어보세요.
Written by
Spark

AI Sparkup

음성AI

GPT-Live, 말 끝나길 기다리지 않는 ChatGPT 음성모드

Thinking Machines 인터랙션 모델, AI와 대화하는 방식을 바꾸는 새로운 접근

GPT-Realtime-2, 실시간 음성에 GPT-5급 추론 결합한 OpenAI 신모델 3종

전화 목소리가 AI인지 모를 수 있다, Gemini 3.1 Flash Live의 등장

구글 AI가 매장에 직접 전화를 건다: Agentic Calling 기능 등장

음성 AI, 스타트업의 새로운 골드러시 – YC 클래스 22%가 선택한 이유

Mistral Voxtral: 음성 AI의 게임체인저가 된 오픈소스 모델

아마존 Nova Sonic: AI 음성 기술의 새로운 지평을 열다

OpenAI Agents SDK로 구현하는 AI 오디오 투어 가이드 만들기

AI Sparkup 구독하기