gpt-image-2는 OpenAI API를 통해 제공되는 고성능 이미지 생성 모델이다. ComfyUI의 OpenAI Partner Node를 사용하면 GPT Image 2를 ComfyUI 워크플로우에 직접 통합해 텍스트→이미지, 이미지→이미지, 인페인팅, 멀티 레퍼런스 생성까지 모두 처리할 수 있다.
사전 준비
- ComfyUI 최신 버전 설치
- OpenAI API 키 (유료 플랜 필요 — GPT Image 2는 API 호출당 과금)
- ComfyUI 매니저를 통해
ComfyUI-OpenAI-Partner커스텀 노드 설치
ComfyUI 매니저에서 노드 설치:
ComfyUI Manager → Custom Nodes Manager → "OpenAI" 검색 → InstallComfyUI를 재시작하면 노드 메뉴에 OpenAI GPT Image 노드가 나타난다.
OpenAI GPT Image 노드 설정
노드를 추가하면 다음 파라미터가 나타난다:
| 파라미터 | 설명 | 권장 초기값 |
|---|---|---|
api_key | OpenAI API 키 | 환경 변수 권장 |
model | 사용할 모델 | gpt-image-2 |
quality | 이미지 품질 | standard (비용 절감) |
size | 출력 이미지 크기 | 1024x1024 |
n | 생성 이미지 수 | 1 |
API 키를 환경 변수로 설정 (권장):
# .env 또는 셸 설정에 추가
export OPENAI_API_KEY="sk-..."이미지 포맷 및 비율 옵션
GPT Image 2는 세 가지 크기를 지원한다:
| 크기 | 비율 | 용도 |
|---|---|---|
1024x1024 | 1:1 (정방형) | SNS, 프로필 이미지 |
1792x1024 | 16:9 (가로) | 썸네일, 배너 |
1024x1792 | 9:16 (세로) | 모바일, 포스터 |
기본 워크플로우
1. 텍스트→이미지 (Text-to-Image)
가장 간단한 구성이다:
[Text Input] → [OpenAI GPT Image 노드] → [Preview Image]Add Node→image/generate→OpenAI GPT Image추가- Text Input 노드를 연결해 프롬프트 입력
size,quality설정Preview Image노드 연결- Queue 실행
프롬프트 팁: GPT Image 2는 텍스트 렌더링에 강하다. 이미지 내에 글자가 포함된 디자인(포스터, 로고, 배너)에도 활용한다.
2. 이미지→이미지 (Image-to-Image)
기존 이미지를 참조해 수정 또는 변형한다:
[Load Image] → [OpenAI GPT Image 노드 (image 입력 포트)] → [Preview Image]
[Text Input: 수정 지시] ↗Load Image노드로 참조 이미지 로드OpenAI GPT Image노드의image포트에 연결- 프롬프트에 원하는 변화 지시 (“배경을 숲으로 바꿔라” 등)
- Queue 실행
3. 인페인팅 (Inpainting — 특정 영역 수정)
이미지의 특정 부분만 변경할 때 사용한다:
[Load Image] ──────────────────────────────→ [OpenAI GPT Image 노드]
[Mask Image (흰색=수정 영역)] → [마스크 포트] ↗
[Text Input: 수정 내용] ──────────────────→ [프롬프트 포트]- 수정할 영역을 흰색으로 표시한 마스크 이미지 준비 (포토샵, GIMP, 또는 ComfyUI 마스킹 툴 사용)
- 원본 이미지와 마스크를 각각
image,mask포트에 연결 - 수정 내용 프롬프트 입력
- Queue 실행
4. 멀티 레퍼런스 생성
여러 참조 이미지를 기반으로 새 이미지를 생성한다:
[Load Image 1] →┐
[Load Image 2] →├→ [Image Batch 노드] → [OpenAI GPT Image 노드]
[Load Image 3] →┘
[Text Input: 합성 지시] → [프롬프트 포트]여러 제품 사진을 합성하거나, 스타일 레퍼런스와 구도 레퍼런스를 동시에 지정할 때 유용하다.
고급 활용
GPT Image 2 + 로컬 업스케일러
GPT Image 2의 최대 출력은 2K(2048px)다. 더 높은 해상도가 필요하면 로컬 업스케일러와 연결한다:
[GPT Image 2 출력] → [Ultimate SD Upscale 노드] → [최종 출력]비용 효율적인 워크플로우:
- GPT Image 2로 고품질 기본 이미지 생성 (API 비용 발생)
- 업스케일링은 로컬 모델로 처리 (추가 비용 없음)
GPT Image 2 + Seedance 2.0 (애니메이션 포트레이트)
GPT Image 2로 고품질 포트레이트를 생성한 뒤 seedance로 애니메이션화한다:
[Text Input: 인물 묘사] → [GPT Image 2] → [Seedance 2.0 노드] → [MP4 출력]활용 사례: 프로필 사진 애니메이션, SNS 콘텐츠, 짧은 소개 영상
비용 고려 사항
GPT Image 2는 호출당 과금된다. ComfyUI에서 반복 실행 시 비용이 누적될 수 있다:
standard품질이hd품질보다 저렴- 프롬프트를 충분히 테스트한 뒤 고품질로 최종 생성
- 개발 중에는 생성 수(
n)를 1로 유지
참고 자료
- GPT Image 2 dans ComfyUI — stablediffusion.blog (2026-05-03)