AI Sparkup

복잡한 AI 세상을 읽는 힘 ⚡

FLUX.1 Krea: ‘AI 같은 느낌’을 벗어난 새로운 이미지 생성 모델

FLUX.1 Krea는 Krea AI와 Black Forest Labs가 협력하여 개발한 오픈소스 이미지 생성 모델로, 기존 AI 이미지들의 흔한 문제점인 ‘인공적인 느낌’을 해결하고 자연스럽고 미적으로 우수한 사진 품질에 집중한 것이 특징입니다.

AI look examples
출처: Krea AI – 기존 AI 이미지들의 전형적인 “AI Look” 문제점들

‘AI Look’ 문제를 정면으로 해결한 모델

AI 이미지 생성 기술이 발전하면서 복잡한 프롬프트 이해, 정확한 텍스트 렌더링, 해부학적 정확성 등 기술적 성능은 크게 향상되었습니다. 하지만 여전히 많은 AI 생성 이미지들은 특유의 ‘인공적인 느낌’을 갖고 있었습니다.

대표적인 AI Look 문제점들:

  • 지나치게 흐릿한 배경
  • 왁스 같은 부자연스러운 피부 질감
  • 뻔하고 지루한 구도
  • 과도하게 밝고 부드러운 이미지 톤

FLUX.1 Krea는 이러한 문제들을 의도적으로 해결하는 데 집중했습니다. 개발팀은 “AI처럼 보이지 않는 AI 이미지 만들기”라는 명확한 목표를 설정하고, 기존의 벤치마크 점수보다는 실제 사용자가 원하는 미적 품질에 초점을 맞췄습니다.

독창적인 모델 훈련 접근법

원시 베이스 모델에서 출발

FLUX.1 Krea의 개발 과정에서 가장 중요한 결정 중 하나는 Black Forest Labs에서 제공받은 flux-dev-raw라는 “원시” 모델을 베이스로 사용한 것입니다. 기존의 많은 오픈소스 모델들이 이미 과도하게 후처리된 “구운” 상태였다면, 이 원시 모델은 다양한 결과물을 생성할 수 있는 가소성을 유지하고 있었습니다.

flux-dev-raw examples
출처: Krea AI – flux-dev-raw 모델의 다양한 생성 결과

의견이 확실한 후처리 과정

일반적인 AI 모델들이 범용적인 선호도를 목표로 하는 것과 달리, FLUX.1 Krea는 의견이 확실한(opinionated) 접근법을 택했습니다. 개발팀은 다양한 취향을 섞어서 평균화하면 오히려 누구도 만족하지 못하는 결과가 나온다고 판단했습니다.

2단계 후처리 파이프라인:

  1. 지도 학습 단계(SFT): 팀의 미적 기준에 부합하는 최고 품질 이미지들을 수작업으로 큐레이션
  2. 인간 피드백 강화학습 단계(RLHF): 내부 선호도 데이터를 활용한 TPO(Trust Region Policy Optimization) 기법 적용

흥미롭게도 개발팀은 100만 개 미만의 상대적으로 적은 데이터로도 충분히 좋은 결과를 얻을 수 있다는 점을 발견했습니다. 양보다는 품질이 훨씬 중요했던 것입니다.

실제 사용법과 설치 가이드

FLUX.1 Krea [dev]는 기존 FLUX.1-dev와 완전히 호환되어 기존 워크플로우에 쉽게 통합할 수 있습니다.

ComfyUI에서 사용하기

필요한 파일들:

  • 확산 모델: flux1-krea-dev.safetensors (원본) 또는 flux1-krea-dev_fp8_scaled.safetensors (저용량 VRAM용)
  • 텍스트 인코더: clip_l.safetensors, t5xxl_fp16.safetensors
  • VAE: ae.safetensors

파일 저장 위치:

ComfyUI/
├── models/
│   ├── diffusion_models/
│   │   └── flux1-krea-dev.safetensors
│   ├── text_encoders/
│   │   ├── clip_l.safetensors
│   │   └── t5xxl_fp16.safetensors
│   └── vae/
│       └── ae.safetensors

Diffusers 라이브러리 사용하기

import torch
from diffusers import FluxPipeline

# 모델 로드
pipe = FluxPipeline.from_pretrained(
    "black-forest-labs/FLUX.1-Krea-dev", 
    torch_dtype=torch.bfloat16
)
pipe.enable_model_cpu_offload()  # VRAM 절약

# 이미지 생성
prompt = "A frog holding a sign that says hello world"
image = pipe(
    prompt,
    height=1024,
    width=1024,
    guidance_scale=4.5,
).images[0]

image.save("flux-krea-dev.png")

다른 FLUX 모델들과의 비교

FLUX 모델 패밀리는 서로 다른 용도에 맞춰 설계된 세 가지 버전을 제공합니다:

FLUX.1 Pro: 상업적 용도의 최고급 모델로, 뛰어난 디테일과 품질을 제공하지만 유료 서비스로만 이용 가능

FLUX.1 Dev: 비상업적 연구/개발 용도로 설계된 모델로, Pro와 유사한 품질을 제공하면서 오픈소스로 공개

FLUX.1 Schnell: 속도에 최적화된 경량 버전으로, Apache 2.0 라이선스 하에 완전 무료

FLUX.1 Krea [dev]: Dev 버전을 베이스로 하되, 미적 품질과 사진적 사실성에 특화된 버전

출처: Hugging Face – FLUX.1 Krea [dev] 모델의 다양한 생성 예시

활용 가능성과 한계점

강점

  • 미적 사진 품질: 자연스러운 조명과 텍스처로 ‘AI Look’ 문제 해결
  • 높은 호환성: 기존 FLUX.1-dev 생태계와 완전 호환
  • 오픈소스: 연구 및 창작 활동에 자유롭게 활용 가능
  • 상업적 이용: 비상업적 라이선스 하에서 개인 및 연구 목적으로 사용 가능

한계점

  • 주관적 미적 기준: 특정 미적 취향에 편향될 수 있음
  • 높은 하드웨어 요구사항: 고품질 생성을 위해서는 상당한 VRAM 필요
  • 비상업적 라이선스: 상업적 용도로는 직접 사용 불가

AI 이미지 생성의 새로운 방향

FLUX.1 Krea의 등장은 AI 이미지 생성 분야에서 중요한 전환점을 보여줍니다. 단순히 프롬프트를 정확히 따르는 것을 넘어, 실제 창작자들이 원하는 미적 품질에 집중한 접근법이 주목받고 있습니다.

특히 ‘의견이 확실한’ 훈련 방식은 향후 AI 모델 개발에서 중요한 시사점을 제공합니다. 모든 사용자를 만족시키려는 범용적 접근보다는, 특정 목적과 취향에 특화된 모델들이 더 실용적일 수 있다는 것을 보여주었습니다.


참고자료:


AI Sparkup 구독하기

구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.

Comments