MiMo-V2.5-Pro는 Xiaomi MiMo 팀이 2026년 4월 27일 오픈소스로 공개한 대형 언어 모델이다. 1.02T 파라미터의 Mixture-of-Experts(MoE) 아키텍처에 42B 활성 파라미터, 하이브리드 어텐션 구조, 1M 토큰 컨텍스트 창을 갖춘 플래그십 모델이다. 이전 모델 MiMo-V2-Pro 대비 일반 에이전트 능력, 복잡한 소프트웨어 엔지니어링, 장기 작업에서 큰 개선을 이뤘다.
HuggingFace 및 Xiaomi AI Studio에서 이용 가능.
성능 벤치마크
| 벤치마크 | MiMo-V2.5-Pro | Claude Opus 4.6 | GPT-5.4 | Gemini 3.1 Pro |
|---|---|---|---|---|
| Coding Agent | 57.2 | 57.3 | 57.7 | 54.2 |
| SWE-Bench Pro | 73.7 | 77.1 | — | 67.8 |
| MiMo Coding Bench | 68.4 | 65.4 | 75.1 | 68.5 |
| Terminal-Bench 2.0 | #3.4 | #2.0 | — | #3.9 |
SWE-Bench Pro에서 Claude Opus 4.6에 다소 뒤지지만, 코딩 에이전트 점수는 거의 동등하고, 자체 MiMo Coding Bench에서는 Claude Opus 4.6을 앞선다.
아키텍처 특징
- 파라미터: 1.02T 총 파라미터, 42B 활성 파라미터 (MoE 희소 활성화)
- 아키텍처: 하이브리드 어텐션(Hybrid Attention) 기반 MoE
- 컨텍스트 창: 1M 토큰
- 특화 영역: 에이전트 작업, 장기 작업(long-horizon tasks), 소프트웨어 엔지니어링
MiMo-V2.5-Pro-UltraSpeed: 1T 파라미터 모델 최초 1000 TPS 돌파
2026년 6월 8일, Xiaomi MiMo 팀은 TileRT와 협력해 MiMo-V2.5-Pro-UltraSpeed를 발표했다. 1T 파라미터급 모델에서 세계 최초로 초당 1000 토큰(TPS) 디코딩 속도를 달성했으며, 최대 약 1200 TPS까지 측정됐다.
UltraSpeed 핵심:
- TileRT 커널 최적화: TileRT의 맞춤형 추론 커널로 대형 MoE 모델의 디코딩 병목을 해소
- “모델을 기다리는” 경험에서 “모델이 생각의 연장”이 되는 경험으로 전환하는 것이 목표
접근 제한: 현재 기업·전문 개발자 대상 신청 기반 제한 공개. platform.xiaomimimo.com/ultraspeed에서 신청 가능 (승인 보장 없음).
MiMo 시리즈 위치
| 모델 | 특징 |
|---|---|
| MiMo-V2.5-Pro-UltraSpeed | 1T 파라미터 최초 1000 TPS 돌파 (제한 공개) |
| MiMo-V2.5-Pro | 플래그십, 에이전트·코딩 특화 |
| MiMo-V2.5 | 중간급, V2.5-Pro보다 가벼움 |
| MiMo-V2-Pro | 이전 세대 플래그십 |
접근 방법
- API: Xiaomi Platform
- 모델 가중치: HuggingFace XiaomiMiMo
- 직접 사용: Xiaomi AI Studio
관련 문서
- qwen — Alibaba의 오픈소스 LLM 시리즈 (유사 대형 MoE 모델)
- kimi — Moonshot AI의 에이전트 특화 오픈소스 LLM
- deepseek-v4 — 초저가 오픈 가중치 MoE 모델
- mimocode — MiMo Auto 채널 기반 Xiaomi의 AI 코딩 에이전트 (터미널, 영구 메모리)
참고 자료
- MiMo-V2.5-Pro 공식 페이지 — Xiaomi MiMo (2026-04-27)
- XiaomiMiMo/MiMo-V2.5-Pro — HuggingFace
- MiMo-V2.5-Pro-UltraSpeed: Pushing 1T-Parameter Model Generation Speed to 1000 TPS — Xiaomi MiMo (2026-06-08)