AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

Bonsai Image 4B – 1비트·3진 양자화로 iPhone에서 돌아가는 이미지 생성 모델

PrismML이 공개한 Bonsai Image 4B는 1-bit 및 3진(ternary) 트랜스포머 가중치로 4B 파라미터 이미지 생성 모델을 극단적으로 압축해, 랩탑·스마트폰 등 로컬 기기에서 고품질 디퓨전 추론을 실행 가능하게 만든 모델군이다. 4B 파라미터 클래스에서 iPhone에서 직접 실행 가능한 최초의 이미지 모델로 알려져 있다.

두 가지 변형

변형가중치 값유효 비트수적합한 케이스
1-bit Bonsai Image 4B{−1, +1} + FP16 그룹 스케일1.125 bpw메모리·대역폭 최우선, 배포 풋프린트 최소화
Ternary Bonsai Image 4B{−1, 0, +1} + FP16 그룹 스케일1.71 bpw비주얼 품질·프롬프트 충실도 우선

Ternary 변형은 가중치에 0 상태가 추가되어 표현력이 더 풍부하다. 1-bit보다 약간 크지만 여전히 기존 FP16/BF16 모델 대비 극도로 경량이다.

왜 중요한가

이미지 생성 모델은 텍스트 LLM보다 훨씬 많은 메모리를 요구해 그동안 클라우드 의존이 강했다. Bonsai Image 4B는 이 한계를 두 방향에서 동시에 공략한다:

  • 개방형 가중치: 누구나 로컬에서 실행하거나 파인튜닝 가능
  • 범용 하드웨어 지원: 랩탑 GPU, CPU, WebGPU(브라우저), iPhone까지

특히 WebGPU 데모를 통해 별도 설치 없이 브라우저에서 이미지 생성을 테스트할 수 있다.

접근 방법

# Hugging Face에서 모델 다운로드 후 Diffusers로 로드 (예시)
from diffusers import DiffusionPipeline
pipe = DiffusionPipeline.from_pretrained("prism-ml/bonsai-image-4b-ternary")
image = pipe("a photo of a cat").images[0]

사용 대상

  • 온디바이스 AI 앱 개발자: 서버 없이 이미지 생성 기능을 iOS/안드로이드 앱에 내장하려는 경우
  • 프라이버시 중시 사용자: 생성 이미지가 외부 서버에 전송되지 않아야 하는 경우
  • 엣지 추론 연구자: 극단적 양자화로 품질이 얼마나 유지되는지 평가하려는 경우

리소스

참고 자료



AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)