AI Toolkit(ostris/ai-toolkit)은 최신 확산 모델(diffusion model)을 파인튜닝하기 위한 올인원 학습 도구다. Flux·HunyuanVideo·Wan·HiDream 등 주요 이미지·영상 모델을 소비자용 GPU에서 실행할 수 있도록 최적화되어 있으며, Gradio 기반 GUI와 CLI를 모두 지원한다. RunPod·Modal 같은 클라우드 환경에서의 학습도 공식 지원한다. 무료 오픈소스로 GitHub에 공개되어 있다.
지원 모델
이미지 모델
- Flux 시리즈 (Flux.1 Dev, Schnell 등)
- Stable Diffusion 3 (SD3)
- HiDream O1
- SDXL 및 이전 SD 계열
영상 모델
- HunyuanVideo
- Wan
- LTX-Video
- Mochi
기타
- 오디오 모델 (실험적)
- Instruction / Edit 모델
주요 특징
| 특징 | 설명 |
|---|---|
| 소비자 GPU 지원 | 고가 서버급 GPU 없이도 파인튜닝 가능 |
| GUI + CLI | Gradio 웹 UI 또는 명령줄 중 선택 |
| 다양한 모델 지원 | 이미지·영상·오디오 모델 통합 학습 |
| 클라우드 학습 | RunPod, Modal 플랫폼 공식 지원 |
| 활발한 업데이트 | 최신 모델 신속 통합 |
설치
git clone https://github.com/ostris/ai-toolkit.git
cd ai-toolkit
git submodule update --init --recursive
python -m venv venv
source venv/bin/activate # Windows: venv\Scripts\activate
pip install torch
pip install -r requirements.txt
# 문제 발생 시:
pip install --upgrade accelerate transformers diffusers huggingface_hubUI 실행
# Gradio 웹 UI
python run_gui.py클라우드 학습
RunPod와 Modal 환경에서 각 플랫폼의 설정 가이드를 따라 세팅하면 동일한 설정 파일로 클라우드에서 학습을 실행할 수 있다.
사용 대상
| 사용자 | 시나리오 |
|---|---|
| AI 아티스트·크리에이터 | 나만의 스타일로 Flux 등 모델을 파인튜닝해 이미지 생성 |
| 연구자 | 최신 확산 모델 아키텍처 실험 |
| 스타트업·개발자 | 커스텀 이미지·영상 생성 모델 구축 |
라이선스 및 링크
- Apache 2.0 라이선스
- GitHub: ostris/ai-toolkit