AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

GPT Image 2 튜토리얼 – ComfyUI에서 Partner Node로 사용하기

gpt-image-2는 OpenAI API를 통해 제공되는 고성능 이미지 생성 모델이다. ComfyUI의 OpenAI Partner Node를 사용하면 GPT Image 2를 ComfyUI 워크플로우에 직접 통합해 텍스트→이미지, 이미지→이미지, 인페인팅, 멀티 레퍼런스 생성까지 모두 처리할 수 있다.

사전 준비

  • ComfyUI 최신 버전 설치
  • OpenAI API 키 (유료 플랜 필요 — GPT Image 2는 API 호출당 과금)
  • ComfyUI 매니저를 통해 ComfyUI-OpenAI-Partner 커스텀 노드 설치

ComfyUI 매니저에서 노드 설치:

ComfyUI Manager → Custom Nodes Manager → "OpenAI" 검색 → Install

ComfyUI를 재시작하면 노드 메뉴에 OpenAI GPT Image 노드가 나타난다.

OpenAI GPT Image 노드 설정

노드를 추가하면 다음 파라미터가 나타난다:

파라미터설명권장 초기값
api_keyOpenAI API 키환경 변수 권장
model사용할 모델gpt-image-2
quality이미지 품질standard (비용 절감)
size출력 이미지 크기1024x1024
n생성 이미지 수1

API 키를 환경 변수로 설정 (권장):

# .env 또는 셸 설정에 추가
export OPENAI_API_KEY="sk-..."

이미지 포맷 및 비율 옵션

GPT Image 2는 세 가지 크기를 지원한다:

크기비율용도
1024x10241:1 (정방형)SNS, 프로필 이미지
1792x102416:9 (가로)썸네일, 배너
1024x17929:16 (세로)모바일, 포스터

기본 워크플로우

1. 텍스트→이미지 (Text-to-Image)

가장 간단한 구성이다:

[Text Input] → [OpenAI GPT Image 노드] → [Preview Image]
  1. Add Nodeimage/generateOpenAI GPT Image 추가
  2. Text Input 노드를 연결해 프롬프트 입력
  3. size, quality 설정
  4. Preview Image 노드 연결
  5. Queue 실행

프롬프트 팁: GPT Image 2는 텍스트 렌더링에 강하다. 이미지 내에 글자가 포함된 디자인(포스터, 로고, 배너)에도 활용한다.

2. 이미지→이미지 (Image-to-Image)

기존 이미지를 참조해 수정 또는 변형한다:

[Load Image] → [OpenAI GPT Image 노드 (image 입력 포트)] → [Preview Image]
              [Text Input: 수정 지시] ↗
  1. Load Image 노드로 참조 이미지 로드
  2. OpenAI GPT Image 노드의 image 포트에 연결
  3. 프롬프트에 원하는 변화 지시 (“배경을 숲으로 바꿔라” 등)
  4. Queue 실행

3. 인페인팅 (Inpainting — 특정 영역 수정)

이미지의 특정 부분만 변경할 때 사용한다:

[Load Image] ──────────────────────────────→ [OpenAI GPT Image 노드]
[Mask Image (흰색=수정 영역)] → [마스크 포트] ↗
[Text Input: 수정 내용] ──────────────────→ [프롬프트 포트]
  1. 수정할 영역을 흰색으로 표시한 마스크 이미지 준비 (포토샵, GIMP, 또는 ComfyUI 마스킹 툴 사용)
  2. 원본 이미지와 마스크를 각각 image, mask 포트에 연결
  3. 수정 내용 프롬프트 입력
  4. Queue 실행

4. 멀티 레퍼런스 생성

여러 참조 이미지를 기반으로 새 이미지를 생성한다:

[Load Image 1] →┐
[Load Image 2] →├→ [Image Batch 노드] → [OpenAI GPT Image 노드]
[Load Image 3] →┘
                  [Text Input: 합성 지시] → [프롬프트 포트]

여러 제품 사진을 합성하거나, 스타일 레퍼런스와 구도 레퍼런스를 동시에 지정할 때 유용하다.

고급 활용

GPT Image 2 + 로컬 업스케일러

GPT Image 2의 최대 출력은 2K(2048px)다. 더 높은 해상도가 필요하면 로컬 업스케일러와 연결한다:

[GPT Image 2 출력] → [Ultimate SD Upscale 노드] → [최종 출력]

비용 효율적인 워크플로우:

  • GPT Image 2로 고품질 기본 이미지 생성 (API 비용 발생)
  • 업스케일링은 로컬 모델로 처리 (추가 비용 없음)

GPT Image 2 + Seedance 2.0 (애니메이션 포트레이트)

GPT Image 2로 고품질 포트레이트를 생성한 뒤 seedance로 애니메이션화한다:

[Text Input: 인물 묘사] → [GPT Image 2] → [Seedance 2.0 노드] → [MP4 출력]

활용 사례: 프로필 사진 애니메이션, SNS 콘텐츠, 짧은 소개 영상

비용 고려 사항

GPT Image 2는 호출당 과금된다. ComfyUI에서 반복 실행 시 비용이 누적될 수 있다:

  • standard 품질이 hd 품질보다 저렴
  • 프롬프트를 충분히 테스트한 뒤 고품질로 최종 생성
  • 개발 중에는 생성 수(n)를 1로 유지

참고 자료



AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)