유료 음성 합성 서비스는 품질이 높지만 비용, API 종속성, 데이터 통제 측면에서 제약이 많다. VoxCPM2는 OpenBMB가 공개한 오픈소스 텍스트 음성 변환(text-to-speech, TTS) 모델로, 20억(2B) 파라미터와 200만 시간 이상의 다국어 음성 학습 데이터를 바탕으로 30개 언어, 음성 디자인(voice design), 제어 가능한 음성 복제(controllable voice cloning), 48kHz 출력을 지원한다. Apache-2.0 라이선스로 공개되어 상용 사용도 가능하다.
무엇이 다른가
많은 오픈소스 TTS 프로젝트는 “텍스트를 읽어준다” 수준에 머무른다. VoxCPM2는 그보다 넓은 작업 범위를 한 모델 안에 묶는다.
- 음성 디자인: 참조 음성 없이 자연어 설명만으로 새 목소리를 만든다.
- 제어 가능한 음성 복제: 짧은 샘플 음성을 바탕으로 말투·속도·감정 같은 스타일을 조정한다.
- 고충실도 복제: 참조 오디오와 전사문을 함께 넣어 원음의 리듬과 표현을 더 가깝게 재현한다.
- 실시간 스트리밍: 응답 전체를 다 만들기 전에 오디오 청크를 순차적으로 반환할 수 있다.
경쟁 도구와 비교
| 항목 | VoxCPM2 | ElevenLabs | 일반 오픈소스 TTS |
|---|---|---|---|
| 배포 방식 | 로컬 추론 + 자체 호스팅 가능 | 주로 클라우드 API | 프로젝트별 상이 |
| 음성 디자인 | 지원 | 일부 워크플로우에서 지원 | 제한적 |
| 음성 복제 | 지원 | 강점 | 일부만 지원 |
| 스트리밍 | 지원 | 지원 | 지원 편차 큼 |
| 라이선스 | Apache-2.0 | 상용 서비스 | 프로젝트별 상이 |
VoxCPM2의 핵심 매력은 “유료 SaaS급 기능 범위를 로컬·오픈소스로 가져온다”는 점이다.
주요 기능
1. 다국어 음성 합성
30개 언어를 지원하며 별도의 언어 태그 없이 입력 텍스트를 바로 합성할 수 있다. 한국어도 공식 지원 언어에 포함된다.
2. 음성 디자인
원본 샘플 없이도 (따뜻하고 차분한 남성 목소리) 같은 자연어 설명으로 목소리를 설계할 수 있다. 캐릭터 음성, 데모 내레이션, 프로토타입 제작에 유용하다.
3. 제어 가능한 음성 복제
짧은 참조 음성을 넣고 새로운 문장을 생성하되, 속도나 감정 같은 스타일을 추가 지시로 조절할 수 있다. 단순 복제보다 제품화에 유리한 방식이다.
4. 실시간 제품 배포
기본 Python API 외에도 CLI, Nano-vLLM, vLLM-Omni 기반 배포 경로가 제공된다. 빠른 로컬 테스트에서 서비스형 배포까지 이어지기 쉽다.
설치와 사용
pip install voxcpmfrom voxcpm import VoxCPM
import soundfile as sf
model = VoxCPM.from_pretrained("openbmb/VoxCPM2", load_denoiser=False)
wav = model.generate(
text="(차분하고 신뢰감 있는 목소리) 안녕하세요. VoxCPM2 데모입니다.",
cfg_value=2.0,
inference_timesteps=10,
)
sf.write("demo.wav", wav, model.tts_model.sample_rate)빠르게 테스트하려면 CLI도 쓸 수 있다.
voxcpm design --text "VoxCPM2 brings studio-quality multilingual speech synthesis." --output out.wav언제 쓰면 좋은가
- API 비용 없이 로컬 음성 생성 파이프라인을 구축하고 싶을 때
- 제품 데모용 다국어 내레이션과 캐릭터 음성을 빠르게 만들고 싶을 때
- 참조 음성을 기반으로 자체 브랜딩 보이스를 실험하고 싶을 때
- 오픈소스 모델 위에 자체 배포·튜닝 체계를 만들고 싶을 때
라이선스와 주의점
모델과 코드는 Apache-2.0으로 공개되어 상용 사용이 가능하다. 다만 고품질 음성 복제가 가능하므로 사칭, 허위 정보, 무단 보이스 클로닝 같은 오남용 리스크를 직접 관리해야 한다.
관련 문서
- gemini-31-flash-tts — Google의 프롬프트 제어형 TTS 모델
참고 자료
- VoxCPM2, a Free ElevenLabs Alternative — Hongkiat (2026-04-18)
- OpenBMB/VoxCPM — GitHub