AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

AI Toolkit – 소비자 GPU에서 이미지·영상 확산 모델을 파인튜닝하는 올인원 학습 도구

AI Toolkit(ostris/ai-toolkit)은 최신 확산 모델(diffusion model)을 파인튜닝하기 위한 올인원 학습 도구다. Flux·HunyuanVideo·Wan·HiDream 등 주요 이미지·영상 모델을 소비자용 GPU에서 실행할 수 있도록 최적화되어 있으며, Gradio 기반 GUI와 CLI를 모두 지원한다. RunPod·Modal 같은 클라우드 환경에서의 학습도 공식 지원한다. 무료 오픈소스로 GitHub에 공개되어 있다.

지원 모델

이미지 모델

  • Flux 시리즈 (Flux.1 Dev, Schnell 등)
  • Stable Diffusion 3 (SD3)
  • HiDream O1
  • SDXL 및 이전 SD 계열

영상 모델

  • HunyuanVideo
  • Wan
  • LTX-Video
  • Mochi

기타

  • 오디오 모델 (실험적)
  • Instruction / Edit 모델

주요 특징

특징설명
소비자 GPU 지원고가 서버급 GPU 없이도 파인튜닝 가능
GUI + CLIGradio 웹 UI 또는 명령줄 중 선택
다양한 모델 지원이미지·영상·오디오 모델 통합 학습
클라우드 학습RunPod, Modal 플랫폼 공식 지원
활발한 업데이트최신 모델 신속 통합

설치

git clone https://github.com/ostris/ai-toolkit.git
cd ai-toolkit
git submodule update --init --recursive

python -m venv venv
source venv/bin/activate   # Windows: venv\Scripts\activate

pip install torch
pip install -r requirements.txt
# 문제 발생 시:
pip install --upgrade accelerate transformers diffusers huggingface_hub

UI 실행

# Gradio 웹 UI
python run_gui.py

클라우드 학습

RunPod와 Modal 환경에서 각 플랫폼의 설정 가이드를 따라 세팅하면 동일한 설정 파일로 클라우드에서 학습을 실행할 수 있다.

사용 대상

사용자시나리오
AI 아티스트·크리에이터나만의 스타일로 Flux 등 모델을 파인튜닝해 이미지 생성
연구자최신 확산 모델 아키텍처 실험
스타트업·개발자커스텀 이미지·영상 생성 모델 구축

라이선스 및 링크



AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)