목차
grok의 Voice Think Fast 1.0은 음성 수신과 오디오 생성을 동시에 처리하는 풀듀플렉스 음성 AI 모델이다. 2026년 4월 출시 직후 τ-voice Bench 리더보드 1위를 달성했다.
Grok Voice Think Fast 1.0이란
기존 음성 AI 시스템은 STT → LLM → TTS의 3단계 파이프라인으로 동작해 각 단계에서 지연이 누적됐다. Grok Voice Think Fast 1.0은 음성 수신과 오디오 출력을 동시에 처리하며 백그라운드 추론을 수행한다.
주요 특징
- 즉각적인 추론: 응답 시간을 늦추지 않고 백그라운드 사고 처리
- 탁월한 소음 내성: 실제 전화 데이터로 학습 — 배경 소음, 억양 변화, 대화 중단에 강함
- 구조화 데이터 캡처: 통화 중 이메일·전화번호 등을 정확히 추출·포맷
- 고볼륨 도구 호출: 성능 저하 없이 여러 도구 병렬 호출
- 다국어 지원: 25개 이상 언어, 동일 통화 내 언어 자동 전환
- 완전 자체 개발: VAD, 토크나이저, 오디오 모델 모두 xAI 자체 구현
가격
| API | 가격 | 용도 |
|---|---|---|
| 음성 에이전트 | $0.05/분 | 라이브 대화, 도구 호출 |
| STT 배치 | $0.10/시간 | 사전 녹음 전사 |
| STT 스트리밍 | $0.20/시간 | 실시간 전사 (WebSocket) |
| TTS | $4.20/100만 자 | 5가지 음성, 20개 언어 |
10분 지원 통화 기준 약 $0.50. OpenAI Realtime API(~$0.10/분)의 절반 수준이다.
코드 없이 음성 에이전트 만들기
console.x.ai/playground/voice/agent에서 API 키 없이 즉시 테스트 가능하다.
에이전트 구성 방법
- + Create Custom 클릭
- 텍스트 박스에 에이전트 설명 입력 (이것이 시스템 프롬프트가 된다)
- Start 클릭
- 마이크로 에이전트와 대화
- 설명 수정 후 재테스트 (이터레이션 ~30초)
음성: Ara, Eve, Leo, Rex, Sal 중 선택 가능. 웹 검색 등 도구도 UI에서 활성화할 수 있다.
예시 1: 세일즈봇
You are a friendly sales advisor for the [제품명].
Your goal: qualify prospects and guide them toward enrollment.
Course details:
- [핵심 특징]
- [가치 제안]
Conversation flow:
1. Greet warmly. Ask what they do and their experience level.
2. Listen for pain points — career growth, skill gaps.
3. Match their needs to specific benefits.
4. Handle objections with empathy. Never be pushy.
5. Ask for name and email to send details.
Tone: Helpful friend. Not a telemarketer.테스트할 페르소나:
- 초심자: “AI에 대해 아무것도 모르는데 도움이 될까요?”
- 회의론자: “실습이 없는 강의만 있는 것 아닌가요?”
- 예산 고민: “투자할 여유가 있는지 모르겠어요.”
예시 2: 커리어 상담 에이전트
기술직 종사자나 학생을 위한 커리어 어드바이저. 청취자의 현재 상황, 목표, 불안 요소를 파악하고 맞춤형 조언을 제공하도록 프롬프트를 설계한다.
API 통합
OpenAI Realtime API 스펙과 호환:
# 기존 OpenAI Realtime 코드에서 엔드포인트만 변경
# api_base = "https://api.openai.com" → "https://api.x.ai"전체 재작성 없이 마이그레이션 가능하다.
일반적인 실수
- 시스템 프롬프트가 너무 길면 오히려 에이전트가 경직됨 — 간결하게 유지
- 도구 호출이 많을수록 응답 품질 확인 필요
- 소음이 많은 환경에서 테스트해 내성을 검증할 것
참고 자료
- Grok Voice Think Fast 1.0: Build Voice AI Agents That Actually Think — Analytics Vidhya (2026-05-01)
- xAI Grok Voice Think Fast 1.0 공식 발표 — xAI