FLUX.1 Kontext(dev) 사용하기
얼마전 Black Forest Labs(이하 BLF)에서 FLUX.1 Kontext 를 공개했다는 소식을 알려드렸습니다. 이 글에서 아직 오픈소스인 dev 버전은 베타테스트 중이라고 말씀드렸는데, 이제 FLUX.1 Kontext (dev)를 사용할 수 있게 되었습니다.
소프트웨어
이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력하며, 현재 거의 대세로 자리잡고 있는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.
FLUX.1 Kontext 모델
FLUX.1 Kontext 모델은 이미지 생성과 편집 기능이 하나의 모델로 통합된 모델입니다. 즉, 그냥 텍스트-이미지 방식으로 이미지를 생성할 수 있을 뿐 아니라, 참조 이미지를 편집할 수도 있습니다.
특히 ChatGPT나 Gemini를 사용하여 스타일을 바꾸는 기능을 보셨을 텐데, FLUX.1 Kontext도 기본적으로 비슷한 방법으로 동작합니다. 즉, 기존의 이미지에 존재하는 어떤 요소를 텍스트 명령만으로 변형할 수 있습니다. 이때 이미지의 피사체와 스타일은 그대로 유지됩니다.
FLUX.1 Kontext는 세가지 버전으로 발표되었습니다.
- Kontext [pro] : 빠르고 부드러운 편집을 위한 핵심 버전. 텍스트 기반의 생성, 이미지 기반의 편집, 스타일 복제 등을 하나의 통합된 프레임워크에서 수행할 수 있음. 대화식 워크플로에 적합
- Kontext [max] : 성능을 위주로 한 버전. 프롬프트의 이해도가 더 높고, 이미지내의 텍스트 처리가 더 정확한 버전. 특히 전문적인 용도에 적합
- Kontext [dev] : 클로즈드 베타 단계의 오픈 소스 버전. 맞춤화 및 기능 개발을 위한 목적. 상용 버전에 비해 기능은 약하지만, 오픈 소스 생태계에 새로운 솔루션이 될 것으로 기대함
이 글에서는 Kontext [dev] 버전을 사용하는 방법을 설명합니다.
따라하기
1 단계: 모델 다운로드
이 워크플로에서는 flux1-kontext-dev.safetensors모델을 사용합니다. 이 파일을 다운로드 받은 후, ComfyUI\models\diffusion_models 폴더에 넣어줍니다.
텍스트 인코더 모델 clip_l.safetensors 및 t5xxl_fp16.safetensors을 다운로드 받은 후, ComfyUI\models\clip 폴더에 넣어줍니다.
VAE 모델 ae.safetensors 을 다운로드 받은 후, ComfyUI\models\VAE 폴더에 넣어줍니다.
2 단계: 워크플로 불러오기
아래의 Json 파일을 다운로드 받아 ComfyUI로 불러옵니다.
이 워크플로를 불러오면 오류가 발생할 수 있습니다. 그러한 경우, 다음과 같은 작업이 필요합니다. 특히, ComfyUI를 실행시키고 ComfyUI 버전이 0.3.43 이상인지 확인해 보세요.
- 처음 사용할 때 - ComfyUI Manager 를 설치해야 합니다.
- ComfyUI를 오랜만에 사용할 때 - ComfyUI를 최신버전으로 업데이트해야 합니다.
- 노드가 없다고 (빨간색) 경고가 뜰 때 - 빠진 커스톰 노드를 가져오기해야 합니다.
- 불러오기 혹은 수행중 에러 발생시 - 커스톰 노드를 업데이트해야 합니다.
3 단계: 이미지 불러오기
아래와 같이 [Load Image] 노드에 원하는 이미지를 불러옵니다.
아래의 이미지를 사용하셔도 됩니다.
4 단계: 프롬프트 검토
여기에서는 카메라를 향해 돌아보도록 명령을 내렸습니다.
5 단계:이미지 생성
이제 화면 오른쪽 위에 있는 Run 버튼을 누르면 워크플로가 실행됩니다. 아래는 입력 이미지와 출력 이미지를 비교한 것입니다.
![]() |
![]() |
참고
5070ti 가 설치된 제 컴퓨터에서 생성시간은 1분 20초 정도됩니다. 그런데, 맨 위에 있는 [TeaCache] 노드를 활성화시키고 실행시키면 대략 35초 정도 소요됩니다. TeaCache를 사용하면 속도는 빠르나 이미지 품질이 약간 떨어질 수 있습니다. 따라서 먼저 TeaCache를 켜고 실행시킨 후, 구도가 마음에 드는 이미지를 사용해서 TeaCache 없이 실행시키는 것이 좋습니다.
그리고... ChatGPT나 Gemini와 마찬가지로, 동양인 얼굴은 일관성이 유지 안되는 경향이 있는 것 같습니다.
이상입니다
이 글은 comfyui-examples의 글을 참고로하여 작성했습니다.
민, 푸른하늘