Moebius는 이미지 인페인팅(inpainting)을 위해 설계된 0.22B 파라미터 경량 확산 프레임워크다. 연구팀은 11.9B 파라미터 FLUX.1-Fill-Dev 대비 2% 미만의 파라미터로 10B급 품질에 근접하거나 일부 벤치마크에서 능가하고, 전체 추론 시간을 15배 이상 줄였다고 주장한다.
핵심 아이디어
대형 범용 모델을 그대로 압축하면 표현 병목이 생긴다. Moebius는 인페인팅이라는 작업에 맞춰 백본을 재구성하고, 잠재 공간(latent space) 안에서 다중 세밀도 지식 증류를 적용해 작은 모델이 큰 teacher의 표현을 흡수하게 한다.
기술 구성
| 구성 | 설명 |
|---|---|
| LλMI block | Local-λ와 Interactive-λ 모듈로 공간 문맥과 전역 의미를 고정 크기 선형 행렬에 요약 |
| Latent Diffusion | 픽셀 디코딩 비용을 피하고 잠재 공간에서 학습·증류 |
| Adaptive Multi-Granularity Distillation | 중간 특징부터 확산 궤적까지 여러 수준의 손실을 동적으로 균형 |
| Latent Categories Guidance | 인페인팅 품질과 구조 보존을 돕는 가이던스 |
사용 대상
- 객체 제거, 배경 복원, 초상 이미지 보정 같은 고빈도 인페인팅 기능을 빠르게 제공해야 하는 제품팀
- 모바일·엣지·소비자 GPU에서 고품질 인페인팅을 돌리려는 연구자
- 거대한 범용 이미지 모델 대신 작업 특화 specialist 모델을 실험하려는 팀
관련 문서
- krea-2 — 창의적 탐색을 겨냥한 오픈 가중치 이미지 생성 모델
- bonsai-image-4b — 저비트 양자화 이미지 생성 모델
- gpt-image-2 — 텍스트 정확도와 해상도를 강조한 이미지 생성 모델
참고 자료
- Moebius Project Page — HUST-VL (2026-06-25)
- hustvl/Moebius — GitHub 공식 저장소