ChatGPT를 개발한 OpenAI의 최신 이미지 생성모델 GPT-Image-1을 ComfyUI에서 기본으로 사용할 수 있게 되었습니다.
[OpenAI GPT Image 1] 노드는 아주 흥미롭습니다. 복잡한 API 키나 코드를 관리할 필요 없이 ComfyUI 워크플로에서 GPT-Image-1 을 직접 접근할 수 있을 뿐 아니라, 다른 API도 사용할 수 있는 길이 열려있기 때문입니다. 즉, 가까운 미래에 BlackForestLabs(FLUX)나 ReCraft와 같은 다른 API도 사용할 수 있을 것으로 예측됩니다.
이 글에서는 ComfyUI에서 GPT-Image-1 API를 사용하는 방법을 설명합니다.
설치 및 사전 요구사항
새로운 [OpenAI GPT Image 1] 노드를 사용하려면, 다음과 같은 사항을 확인해보셔야 합니다.
- ComfyUI가 최신버전인지 확인합니다. 버전이 v0.3.30 이상이어야 합니다. ComfyUI의 현재 버전은 아래와 같이 ComfyUI Manager를 실행시키면 확인할 수 있습니다.
- comfy.org의 계정이 필요합니다. 계정이 없으시다면 Settings->User->Login 에 들어가 생성할 수 있습니다.
- 아울러 API 크레딧(API를 실행시키는 비용)을 구입해야 합니다. Settings->Credits->Purchase Credits에서 구입하시면 됩니다.
ComfyUI 계정에 관하여 2025년 초부터 ComfyUI 에서는 선택적이지만 거의 필수에 가까운 사용자 계정 시스템을 제공하고 있습니다. 특히 Nodes API를 사용할 경우에는 계정 가입이 필수입니다. 계정 성성은 무료이며, 다음과 같은 기능을 제공합니다. - ComfyUI 클라우드 서비스에 접근할 수 있습니다. - 선불 크레딧(OpenAI 계정은 필요없음)을 구입하고 관리할 수 있습니다. - 크레딧 사용 이력을 추적 관리할 수 있습니다. 더 자세한 사항은 이 글을 읽어보시기 바랍니다. |
GPT-Image-1 노드 사용법
아래는 [OpenAI GPT Image 1] 노드를 사용해 이미지를 생성하는 아주 간단한 워크플로입니다. 그냥 ChatGPT 사용하는 것처럼 프롬프트를 넣어주시기만 하면 이미지가 생성됩니다.
아래는 생성된 이미지입니다.
노드 설정
가운데 있는 [OpenAI GPT Image 1] 노드는 아래와 같습니다.
- 프롬프트: 보시는 것처럼 프롬프트를 한글로 입력했습니다. 물론 영어로 입력해도 되고요. 원하는 이미지를 가능하면 정확하게 묘사하시면 됩니다.
- Seed : 씨드 번호입니다.
- control after generate : 씨드번호를 어떻게 관리할지를 설정합니다. fixed, increment, decrement, randomize 등이 있습니다.
- quality : 생성하는 이미지의 품질입니다. low/medium/high로 설정할 수 있는데, high로 갈수록 크레딧이 많이 소요됩니다.
- background : opaque를 선택하면 일반 이미지가 생성되고, Transparent를 선택하면 배경이 투명해집니다.
- size : 현재 네가지 종류가 있습니다.
- auto - 이미지 크기가 알아서 결정됩니다.
- 1024x1024 - 정사각형
- 1024x1536 - 초상화(portrait) 스타일
- 1536x1024 - 풍경화(landscape) 스타일
- n : 생성하려는 이미지의 수
이미지를 입력받아 변환하기
아래는 요즘 유행하는 지비리 스타일로 변환하는 워크플로입니다. 아래의 json 파일을 다운로드 받아서 불러오시면 사용하실 수 있습니다.
사용하는 이미지는 김태리님 사진인데, 그냥 아무 사진이나 사용하시면 됩니다. 김태리님을 닮았다는 느낌은 없네요. ㅎㅎ
다른 설정은 위의 내용과 동일합니다.
사용시 주의사항
- 프롬프트를 가능한 한 자세하게 - 위에서도 설명한 것처럼, [OpenAI GPT Image 1] 노드는 ChatGPT를 사용하기 때문에 아무리 긴 프롬프트라도 아주 잘 이해합니다. 사실 객체나 감정, 스타일등을 자세하게 적을 수록 원하는 결과를 얻기 쉽습니다.
- 씨드 고정 - 씨드가 달라지면 아얘 다른 내용으로 생성되므로, 일단 씨드를 고정시켜서 생성한 뒤, 부족하다 싶은 내용을 보완하는 것이 좋습니다. 이제 좀 괜찮다고 생각될 때 씨드 값을 변경해 다른 스타일의 이미지를 생성하세요.
- 다른 노드와 결합해 사용하기 - [GPT Image 1] 노드를 단독으로 상용해도 좋은 이미지를 생성할 수 있지만, upscaler나 wan 2.1, hunyuan 등의 비디오 생성 모델과 결합하는 등으로 활용하면 훨씬 멋진 결과물을 얻을 수 있습니다.
사용 비용
API 사용비용은 토큰에 비례하여 책정된다고 합니다. 즉, 한번 생성을 하면 어느정도의 토큰이 책정되고, 선납한 크레딧에서 이를 감산하는 방식으로 진행됩니다.
텍스트 토큰은 백만개 당 $5, 이미지 토큰은 백만개당 $10로 책정되어 있으며, 출력 이미지 토큰 당 $40 달러라고 하는데, 이는 기본적으로 OpenAI에 책정된 비용과 동일하다고 합니다. 그런데... 이렇게 하면 정확히 얼마가 소요되는지 머리가 정말 아픕니다. 그냥 이미지 한장당 비용으로 환산하면 대략 아래와 같습니다.
- $0.02 / low 품질 이미지
- $0.07 / medium 품질 이미지
- $0.19 / high 품질 이미지
저는 이 글을 쓰면서 low 품질로 3장을 생성했더니 아래와 같이 나오네요. ㅎㅎ
비용 최적화 방법
- 필요에 따라 품질을 선택해서 생성할 것 - 빠르게 테스트할 때에는 저품질(low)로 생성하고, 최종 렌더링 때만 high로 생성하는 것이 좋습니다.
- 정사각형 형식 사용 - 기본적으로 정사각형 1:1 이미지가 비용이 저렴하다고 하네요.
- 씨드 고정 - 동일한 프롬프트에 씨드만 바꿔서 재생성하면 비용이 추가될 수 있다네요.
결론
그 동안에도 GPT-4o로 생성된 이미지를 다시 ComfyUI에서 확대하거나 비디오로 전환하는 등의 작업을 하는 경우가 있었는데, [OpenAI GPT Image 1] 사용할 수 있게 되어, Open AI의 이미지 생성 AI를 훨씬 더 쉽게 사용할 수 있게 된 것 같습니다. 아직은 계속 수정중인 듯 한데, 이미지 생성모델을 다른 것으로 교체해서 사용하는 방법도 있을 것 같고...아무튼 여러가지로 확장이 되면 쓸모가 많아지지 않을까 싶습니다.
다만, 비용이 좀 문제겠네요. ChatGPT를 사용하면 하루에 몇장 정도는 무료로 생성할 수 있는데, 이 노드를 사용하면 장당으로 무조건 비용이 나가니, 적절하게 사용해야 할 것 같습니다. 특히 저는 (잠시만) Plus 회원으로 사용하고 있는데, 이미지를 많이 생성할 거면 오히려 Plus로 가입해서 생성하는 게 이 노드를 사용하는 것보다 비용면에서 유리하지 않을까... 하는 생각이 드네요.
이상입니다~
이 글은 stablediffusion.blog의 글을 참고로 작성하였습니다.
- ComfyUI로 설치 및 사용법 기초
- ComfyUI 투토리얼
- ComfyUI를 위한 유용한 정보
- ComfyUI와 SDXL 사용법(1) - 기초
- ComfyUI에서 ControlNet 사용법
- 편리한 ComfyUI 워크플로 모음
- LCM-LoRA - 초고속 스테이블 디퓨전
- Stable Video Diffusion(비디오 스테이블 디퓨전)
- Stable Diffusion 인공지능 이미지 생초보 가이드
- Stable Diffusion 대표 UI - AUTOMATIC1111 설치방법
- Automatic1111 GUI: 초보자 가이드(메뉴 해설)
- Stable Diffusion에 대한 기본적인 이론
- ChatGPT로 스테이블 디퓨전 프롬프트 만들기