AI 이미지 편집의 새로운 전환점이 찾아왔습니다. 그동안 고성능 이미지 편집 AI는 대부분 유료 서비스나 독점 도구의 영역이었지만, Black Forest Labs가 출시한 FLUX.1 Kontext [dev]가 이 판도를 완전히 바꿔놓았습니다. 12B 파라미터의 강력한 성능을 개인 컴퓨터에서도 무료로 사용할 수 있게 된 것입니다.
더욱 놀라운 것은 출시 첫날부터 ComfyUI에서 네이티브 지원을 제공한다는 점입니다. 복잡한 설정 없이도 바로 시작할 수 있어, AI 이미지 편집에 관심이 있는 누구나 쉽게 접근할 수 있습니다.
ComfyUI에서 FLUX.1 Kontext [dev] 워크플로우 인터페이스
FLUX.1 Kontext [dev]의 핵심 특징
혁신적인 멀티모달 편집 능력
FLUX.1 Kontext [dev]는 단순한 이미지 생성 모델이 아닙니다. 텍스트와 이미지를 동시에 입력받아 이미지의 맥락을 지능적으로 이해하고 정교한 편집을 수행하는 멀티모달 이미지 편집 모델입니다.
이 모델의 가장 큰 강점은 다음 세 가지 핵심 기능에 있습니다:
캐릭터 일관성 유지 (Character Consistency)
여러 장면과 환경에서도 특정 인물이나 객체의 고유한 특징을 그대로 유지합니다. 같은 캐릭터를 다양한 상황에 배치하면서도 일관된 모습을 보여주는 것이 가능합니다.
정밀한 로컬 편집 (Local Editing)
이미지의 특정 부분만을 타겟으로 하여 나머지 영역에는 영향을 주지 않고 수정할 수 있습니다. 예를 들어, 인물의 헤어스타일만 바꾸거나 배경의 특정 객체만 교체하는 것이 가능합니다.
스타일 참조 (Style Reference)
참조 이미지의 독특한 스타일을 보존하면서 텍스트 프롬프트에 따라 새로운 장면을 생성할 수 있습니다. 특정 아티스트의 화풍이나 사진 스타일을 다른 이미지에 적용하는 것이 가능합니다.
독점 도구에 맞먹는 오픈소스 성능
Black Forest Labs가 공개한 벤치마크 결과에 따르면, FLUX.1 Kontext [dev]는 기존의 오픈소스 이미지 편집 모델들(Bytedance Bagel, HiDream-E1-Full)뿐만 아니라 Google의 Gemini-Flash Image와 같은 상용 모델들까지 능가하는 성능을 보여줍니다.
ComfyUI에서 FLUX.1 Kontext [dev] 시작하기
필수 모델 파일 다운로드
FLUX.1 Kontext [dev]를 사용하기 위해서는 몇 가지 모델 파일을 다운로드해야 합니다. 다음 파일들을 ComfyUI의 지정된 폴더에 저장해주세요:
Diffusion Model
flux1-dev-kontext_fp8_scaled.safetensors
→ComfyUI/models/diffusion_models/
VAE (Variational Autoencoder)
ae.safetensors
→ComfyUI/models/vae/
Text Encoder
clip_l.safetensors
→ComfyUI/models/text_encoders/
t5xxl_fp16.safetensors
또는t5xxl_fp8_e4m3fn_scaled.safetensors
→ComfyUI/models/text_encoders/
모든 모델 파일은 Hugging Face의 공식 저장소에서 다운로드할 수 있으며, ComfyUI 워크플로우에서 직접 다운로드 링크를 확인할 수도 있습니다.
간단한 3단계 시작 방법
ComfyUI에서 FLUX.1 Kontext [dev]를 사용하는 방법은 놀라울 정도로 간단합니다:
- ComfyUI 업데이트: 최신 버전의 ComfyUI 또는 ComfyUI Desktop을 사용하세요
- 템플릿 선택:
Workflow
→Browse Templates
→Flux
→Flux.1 Kontext Dev
로 이동 - 바로 실행: 원하는 템플릿을 클릭하고 실행하면 됩니다!
ComfyUI의 FLUX.1 Kontext [dev] 템플릿 브라우저
실제 활용 사례와 프롬프트 작성법
스타일 변환의 마법
FLUX.1 Kontext [dev]의 가장 인상적인 기능 중 하나는 스타일 변환입니다. 원본 이미지의 구성과 캐릭터는 그대로 유지하면서 완전히 다른 예술 스타일로 변환할 수 있습니다.
프롬프트 예시: "Transform to 1960s pop art style with bright colors, bold graphics, and commercial aesthetics"
이런 프롬프트를 사용하면 일반적인 사진을 앤디 워홀 스타일의 팝아트로 변환할 수 있습니다. 중요한 것은 원본의 인물이나 객체의 특징은 그대로 유지된다는 점입니다.
정밀한 객체 편집
특정 부분만을 수정하고 싶을 때 FLUX.1 Kontext [dev]의 진가가 발휘됩니다. 예를 들어, 이미지 내의 텍스트만 바꾸거나 특정 객체의 색상만 변경하는 것이 가능합니다.
텍스트 편집 예시: "Add ASCII style text only the single word 'In' no additional letters to the display"
이런 프롬프트로 기존 이미지에 새로운 텍스트를 자연스럽게 추가하거나 기존 텍스트를 교체할 수 있습니다.
시점과 각도 변경
3D 이해능력이 뛰어난 FLUX.1 Kontext [dev]는 같은 객체를 다른 각도에서 보여주는 것도 가능합니다.
카메라 각도 변경 예시: "Rotate the camera 180 degrees to view directly from behind the dog, showing its back and tail while maintaining the same 3D style"
이런 프롬프트를 사용하면 정면에서 촬영된 강아지 사진을 뒷모습으로 변환하면서도 같은 스타일과 특징을 유지할 수 있습니다.
FLUX.1 Kontext [dev]로 생성한 1960년대 팝아트 스타일 변환 결과
효과적인 프롬프트 작성 전략
구체적이고 명확한 지시
FLUX.1 Kontext [dev]에서 최상의 결과를 얻으려면 프롬프트 작성이 매우 중요합니다. 모호한 표현보다는 구체적이고 명확한 지시를 해야 합니다.
잘못된 예: "Make it a sketch"
올바른 예: "Convert to pencil sketch with natural graphite lines, cross-hatching, and visible paper texture"
보존할 요소 명시
편집 과정에서 변경되지 않아야 할 부분을 명확히 지정하는 것이 중요합니다.
프레임워크: "Change [수정할 부분] to [원하는 상태], keep [보존할 요소] unchanged"
예시: "Change the background to a beach while keeping the person in the exact same position, scale, and pose"
단계적 편집 접근
복잡한 변화가 필요한 경우에는 한 번에 모든 것을 바꾸려 하지 말고 단계적으로 접근하는 것이 효과적입니다. 먼저 배경을 바꾸고, 그다음 인물의 표정이나 포즈를 수정하는 식으로 진행하면 더 나은 결과를 얻을 수 있습니다.
고급 활용법과 워크플로우 최적화
그룹 노드를 활용한 워크플로우 간소화
ComfyUI에서는 FLUX.1 Kontext Image Edit 그룹 노드를 제공하여 복잡한 워크플로우를 간소화할 수 있습니다. 이 그룹 노드를 사용하면 개별 노드들을 일일이 연결할 필요 없이 간단하게 이미지 편집 작업을 수행할 수 있습니다.
다중 이미지 합성과 편집
ComfyUI의 Image Stitch
노드와 FLUX.1 Kontext [dev]를 조합하면 여러 이미지를 하나로 합성한 후 통합적으로 편집하는 것도 가능합니다. 이는 복합적인 장면을 만들거나 여러 요소를 조합한 창작물을 제작할 때 유용합니다.
반복적 편집 워크플로우
Load Image(from output)
노드를 사용하면 편집 결과를 다시 입력으로 사용하여 반복적인 편집이 가능합니다. 이를 통해 점진적으로 원하는 결과에 도달할 수 있습니다.
그룹 노드를 활용한 고급 FLUX.1 Kontext [dev] 워크플로우
기술적 혁신과 최적화
NVIDIA Blackwell 아키텍처 최적화
FLUX.1 Kontext [dev]는 NVIDIA의 최신 Blackwell 아키텍처에 최적화되어 있습니다. Black Forest Labs는 NVIDIA와 협력하여 TensorRT 가중치를 특별히 제작했으며, 이를 통해 추론 속도가 크게 향상되고 메모리 사용량이 줄어들었습니다.
다양한 정밀도 옵션(BF16, FP8, FP4)을 제공하여 사용자의 하드웨어 환경과 품질 요구사항에 맞춰 선택할 수 있습니다.
상용화를 위한 라이선스 정책
FLUX.1 Kontext [dev]는 비상업적 용도로는 무료로 사용할 수 있지만, 상업적 활용을 위해서는 별도의 라이선스가 필요합니다. Black Forest Labs는 투명한 라이선스 조건과 표준화된 상업적 조건을 제공하는 셀프서브 라이선스 포털을 통해 비즈니스가 쉽게 FLUX.1 모델들을 상업 제품과 서비스에 통합할 수 있도록 지원하고 있습니다.
창작자들에게 열린 새로운 가능성
FLUX.1 Kontext [dev]의 등장은 AI 이미지 편집 분야에 민주화를 가져왔습니다. 이전까지는 고가의 소프트웨어나 클라우드 서비스에 의존해야 했던 고품질 이미지 편집 작업을 이제 개인 컴퓨터에서도 무료로 수행할 수 있게 되었습니다.
디지털 아티스트, 콘텐츠 크리에이터, 마케터, 그리고 AI 기술에 관심 있는 모든 사람들이 이 강력한 도구를 활용하여 창의성의 한계를 확장할 수 있습니다. 특히 ComfyUI의 직관적인 인터페이스와 결합되어 기술적 진입장벽이 크게 낮아진 것은 더욱 의미 있는 발전입니다.
앞으로 오픈소스 AI 모델들이 어떤 새로운 가능성을 열어갈지 기대가 됩니다. FLUX.1 Kontext [dev]는 그 여정의 중요한 이정표가 될 것으로 보입니다.
참고자료:
Comments