AI 이미지/워크플로 따라하기

기계 곤충 비디오(ComfyUI)

하늘이푸른오늘 2025. 4. 15. 15:46

이 워크플로는 텍스트 프롬프트로부터 아름다운 기계 곤충 비디오를 생성하는 워크플로입니다. 이 워크플로는 FLUX AI를 사용하여 고품질의 이미지를 생성한 후, Wan 2.1 Video를 사용하여 비디오를 생성합니다.

소프트웨어

이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력하며, 현재 거의 대세로 자리잡고 있는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법초보가이드를 확인하시기 바랍니다.

워크플로 작동 원리

이 워크플로 전반부는 Flux.1 dev를 사용하여 고품질의 이미지를 생성합니다. 이 부분은 제가 요즘 자주 사용하는 워크플로를 약간 수정한 겁니다. 수정한 부분은 맨 오른쪽으로, 생성된 이미지를 [Image Sender] 노드를 사용해서 [Image Receiver]노드로 보내기 위한 목적입니다.

이 워크플로 후반부는 생성된 이미지를 사용하여 Wan 2.1 i2v 모델로 이미지를 생성하는 부분입니다. 이 워크플로는 Wan2.1 i2v 워크플로와 거의 비슷하며, 720*480  61 프레임을 생성하는데 샘플링 시간만 약 15분 정도 소요됩니다.

따라하기

1 단계: 모델 다운로드

Flux 모델

이 워크플로에서는 flux1-dev.sft 모델을 사용합니다. 이 파일을 다운로드 받은 후, ComfyUI\models\unet 또는 ComfyUI\models\diffusion_models 에 넣어줍니다.

VAE 모델 ae.safetensors 을 다운로드 받은 후, ComfyUI\models\VAE 폴더에 넣어줍니다. 저는 FLUX라는 서브 폴더를 만들어서 넣어주었습니다.

Wan 2.1 모델

wan2.1_i2v_480p_14B_fp16.safetensors 모델을 다운로드 받아, ComfyUI\models\unet 또는 ComfyUI\models\diffusion_models 에 넣어줍니다.

umt5_xxl_fp8_e4m3fn_scaled.safetensors 모델을 다운로드 받아, ComfyUI\modes\text_encoders 폴더에 넣어줍니다.

clip_vision_h.safetensors 모델을 다운로드 받아, ComfyUI\models\clip_vision 폴더에 넣어줍니다.

wan_2.1_vae.safetensors 모델을 다운로드 받아, ComfyUI\models\vae 폴더에 넣어줍니다. 저는 Video라는 서브 폴더를 만들어서 넣어주었습니다.

2 단계: 워크플로 불러오기

아래의 Json 파일을 다운로드 받아 ComfyUI로 불러옵니다.

Flux1-Wan-mech-insect.json
0.04MB

이 워크플로를 불러오면 오류가 발생할 수 있습니다. 그러한 경우, 다음과 같은 작업이 필요합니다.

3 단계: 프롬프트 검토

이 워크플로에서는 이미지 생성과 비디오 생성에 모두 동일한 프롬프트를 사용합니다. 따라서 이 프롬프트에는 비디오 생성에 필요한 곤충의 움직임(leg moves, foraging, walking) 이 포함되어 있습니다.

4 단계: 이미지 생성

이 워크플로 맨위에는 아래와 같은 [Fast Groups Muter] 노드가 있습니다. 먼저 아래와 같이 Wan 2.1 그룹은 끄고 실행시키면 이미지가 생성됩니다. 이미지가 마음에 안들면 마음에 드는 이미지가 나올때까지 반복해서 돌려줍니다. (KSampler 의 Seed 번호가 fixed 로 고정되어 있으니, 1씩 증가시키면서 실행시키면 됩니다)

그 다음, 아래와 같이 [Flux Text2Image] 그룹은 끄고, [Wan 2.1] 그룹을 켜고 작동시키면 비디오가 생성됩니다. 곤충의 움직임이 마음에 안들면 마음에 들 때까지 계속 반복해서 돌리면 됩니다. (KSampler 의 Seed 번호가 fixed 로 고정되어 있으니, 1씩 증가시키면서 실행시키면 됩니다)

이상입니다. 

이 글은 stable-diffusion-art.com의 글을 참고로하여 작성하였습니다.