PrismML이 공개한 Bonsai Image 4B는 1-bit 및 3진(ternary) 트랜스포머 가중치로 4B 파라미터 이미지 생성 모델을 극단적으로 압축해, 랩탑·스마트폰 등 로컬 기기에서 고품질 디퓨전 추론을 실행 가능하게 만든 모델군이다. 4B 파라미터 클래스에서 iPhone에서 직접 실행 가능한 최초의 이미지 모델로 알려져 있다.
두 가지 변형
| 변형 | 가중치 값 | 유효 비트수 | 적합한 케이스 |
|---|---|---|---|
| 1-bit Bonsai Image 4B | {−1, +1} + FP16 그룹 스케일 | 1.125 bpw | 메모리·대역폭 최우선, 배포 풋프린트 최소화 |
| Ternary Bonsai Image 4B | {−1, 0, +1} + FP16 그룹 스케일 | 1.71 bpw | 비주얼 품질·프롬프트 충실도 우선 |
Ternary 변형은 가중치에 0 상태가 추가되어 표현력이 더 풍부하다. 1-bit보다 약간 크지만 여전히 기존 FP16/BF16 모델 대비 극도로 경량이다.
왜 중요한가
이미지 생성 모델은 텍스트 LLM보다 훨씬 많은 메모리를 요구해 그동안 클라우드 의존이 강했다. Bonsai Image 4B는 이 한계를 두 방향에서 동시에 공략한다:
- 개방형 가중치: 누구나 로컬에서 실행하거나 파인튜닝 가능
- 범용 하드웨어 지원: 랩탑 GPU, CPU, WebGPU(브라우저), iPhone까지
특히 WebGPU 데모를 통해 별도 설치 없이 브라우저에서 이미지 생성을 테스트할 수 있다.
접근 방법
# Hugging Face에서 모델 다운로드 후 Diffusers로 로드 (예시)
from diffusers import DiffusionPipeline
pipe = DiffusionPipeline.from_pretrained("prism-ml/bonsai-image-4b-ternary")
image = pipe("a photo of a cat").images[0]사용 대상
- 온디바이스 AI 앱 개발자: 서버 없이 이미지 생성 기능을 iOS/안드로이드 앱에 내장하려는 경우
- 프라이버시 중시 사용자: 생성 이미지가 외부 서버에 전송되지 않아야 하는 경우
- 엣지 추론 연구자: 극단적 양자화로 품질이 얼마나 유지되는지 평가하려는 경우
리소스
- Hugging Face 모델 컬렉션
- WebGPU 브라우저 데모
- Bonsai Image 데모
- GitHub (데모 코드)
- 백서 (PDF)
- Bonsai Studio for iPhone (App Store)
참고 자료
- Introducing 1-bit and Ternary Bonsai Image 4B: Image Generation for Local Devices — PrismML (2026-05-26)