AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

Moebius – 0.22B 경량 이미지 인페인팅 프레임워크

Moebius는 이미지 인페인팅(inpainting)을 위해 설계된 0.22B 파라미터 경량 확산 프레임워크다. 연구팀은 11.9B 파라미터 FLUX.1-Fill-Dev 대비 2% 미만의 파라미터로 10B급 품질에 근접하거나 일부 벤치마크에서 능가하고, 전체 추론 시간을 15배 이상 줄였다고 주장한다.

핵심 아이디어

대형 범용 모델을 그대로 압축하면 표현 병목이 생긴다. Moebius는 인페인팅이라는 작업에 맞춰 백본을 재구성하고, 잠재 공간(latent space) 안에서 다중 세밀도 지식 증류를 적용해 작은 모델이 큰 teacher의 표현을 흡수하게 한다.

기술 구성

구성설명
LλMI blockLocal-λ와 Interactive-λ 모듈로 공간 문맥과 전역 의미를 고정 크기 선형 행렬에 요약
Latent Diffusion픽셀 디코딩 비용을 피하고 잠재 공간에서 학습·증류
Adaptive Multi-Granularity Distillation중간 특징부터 확산 궤적까지 여러 수준의 손실을 동적으로 균형
Latent Categories Guidance인페인팅 품질과 구조 보존을 돕는 가이던스

사용 대상

  • 객체 제거, 배경 복원, 초상 이미지 보정 같은 고빈도 인페인팅 기능을 빠르게 제공해야 하는 제품팀
  • 모바일·엣지·소비자 GPU에서 고품질 인페인팅을 돌리려는 연구자
  • 거대한 범용 이미지 모델 대신 작업 특화 specialist 모델을 실험하려는 팀

관련 문서

  • krea-2 — 창의적 탐색을 겨냥한 오픈 가중치 이미지 생성 모델
  • bonsai-image-4b — 저비트 양자화 이미지 생성 모델
  • gpt-image-2 — 텍스트 정확도와 해상도를 강조한 이미지 생성 모델

참고 자료



AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)