AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

VoxCPM2 – ElevenLabs 대안으로 주목받는 오픈소스 다국어 TTS 모델

유료 음성 합성 서비스는 품질이 높지만 비용, API 종속성, 데이터 통제 측면에서 제약이 많다. VoxCPM2는 OpenBMB가 공개한 오픈소스 텍스트 음성 변환(text-to-speech, TTS) 모델로, 20억(2B) 파라미터와 200만 시간 이상의 다국어 음성 학습 데이터를 바탕으로 30개 언어, 음성 디자인(voice design), 제어 가능한 음성 복제(controllable voice cloning), 48kHz 출력을 지원한다. Apache-2.0 라이선스로 공개되어 상용 사용도 가능하다.

무엇이 다른가

많은 오픈소스 TTS 프로젝트는 “텍스트를 읽어준다” 수준에 머무른다. VoxCPM2는 그보다 넓은 작업 범위를 한 모델 안에 묶는다.

  • 음성 디자인: 참조 음성 없이 자연어 설명만으로 새 목소리를 만든다.
  • 제어 가능한 음성 복제: 짧은 샘플 음성을 바탕으로 말투·속도·감정 같은 스타일을 조정한다.
  • 고충실도 복제: 참조 오디오와 전사문을 함께 넣어 원음의 리듬과 표현을 더 가깝게 재현한다.
  • 실시간 스트리밍: 응답 전체를 다 만들기 전에 오디오 청크를 순차적으로 반환할 수 있다.

경쟁 도구와 비교

항목VoxCPM2ElevenLabs일반 오픈소스 TTS
배포 방식로컬 추론 + 자체 호스팅 가능주로 클라우드 API프로젝트별 상이
음성 디자인지원일부 워크플로우에서 지원제한적
음성 복제지원강점일부만 지원
스트리밍지원지원지원 편차 큼
라이선스Apache-2.0상용 서비스프로젝트별 상이

VoxCPM2의 핵심 매력은 “유료 SaaS급 기능 범위를 로컬·오픈소스로 가져온다”는 점이다.

주요 기능

1. 다국어 음성 합성

30개 언어를 지원하며 별도의 언어 태그 없이 입력 텍스트를 바로 합성할 수 있다. 한국어도 공식 지원 언어에 포함된다.

2. 음성 디자인

원본 샘플 없이도 (따뜻하고 차분한 남성 목소리) 같은 자연어 설명으로 목소리를 설계할 수 있다. 캐릭터 음성, 데모 내레이션, 프로토타입 제작에 유용하다.

3. 제어 가능한 음성 복제

짧은 참조 음성을 넣고 새로운 문장을 생성하되, 속도나 감정 같은 스타일을 추가 지시로 조절할 수 있다. 단순 복제보다 제품화에 유리한 방식이다.

4. 실시간 제품 배포

기본 Python API 외에도 CLI, Nano-vLLM, vLLM-Omni 기반 배포 경로가 제공된다. 빠른 로컬 테스트에서 서비스형 배포까지 이어지기 쉽다.

설치와 사용

pip install voxcpm
from voxcpm import VoxCPM
import soundfile as sf

model = VoxCPM.from_pretrained("openbmb/VoxCPM2", load_denoiser=False)
wav = model.generate(
    text="(차분하고 신뢰감 있는 목소리) 안녕하세요. VoxCPM2 데모입니다.",
    cfg_value=2.0,
    inference_timesteps=10,
)
sf.write("demo.wav", wav, model.tts_model.sample_rate)

빠르게 테스트하려면 CLI도 쓸 수 있다.

voxcpm design --text "VoxCPM2 brings studio-quality multilingual speech synthesis." --output out.wav

언제 쓰면 좋은가

  • API 비용 없이 로컬 음성 생성 파이프라인을 구축하고 싶을 때
  • 제품 데모용 다국어 내레이션과 캐릭터 음성을 빠르게 만들고 싶을 때
  • 참조 음성을 기반으로 자체 브랜딩 보이스를 실험하고 싶을 때
  • 오픈소스 모델 위에 자체 배포·튜닝 체계를 만들고 싶을 때

라이선스와 주의점

모델과 코드는 Apache-2.0으로 공개되어 상용 사용이 가능하다. 다만 고품질 음성 복제가 가능하므로 사칭, 허위 정보, 무단 보이스 클로닝 같은 오남용 리스크를 직접 관리해야 한다.

관련 문서

참고 자료


AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)