AI 이미지 280

구글 Imagen 4 사용 방법

구글이 Google I/O 2025에서 최신 버전의 이미지 생성모델 Imagen 4를 발표했습니다. 한층 더 디테일이 살아있는 이미지를 생성할 수 있으며, 특히 프롬프트 이해도가 훨씬 높아졌고 이미지에 텍스트를 렌더링하는 능력도 올라갔습니다. 구글은 Gemini 2.5 Flash 등 일련의 인공지능 제품/서비스에서 ChatGPT 등에서 빼앗겼던 주도권을 되찾는 중으로, Imagen 4도 미드저니나 Flux, GPT-Image와 같은 경쟁자를 바짝 추격하거나 앞서기 시작하고 있습니다.새로운 생성 모델사용 방법Gemini에서 사용하는 방법Whisk에서 사용하는 방법아래는 2025년 6월 18일 현재 Text-to-Image 서비스에 대한 Leaderboard입니다. 역시 아직도 GPT-4o가 1등을 차지하..

AI 이미지 2025.06.17

Wan VACE V2V(비디오로 비디오 생성하기)

Wan 2.1 VACE(Video All-in-one Creation and Editing)은 알리바바 팀이 개발한 비디오 생성/편집 모델로서 자신의 컴퓨터에서 로컬로 생성할 수 있습니다. 이 모델은 텍스트-비디오, 레퍼런스-비디오, 비디오-비디오(자세 및 depth), 인페인트, 아웃페인트 등을 모두 처리할 수 있는 통합 모델입니다.소프트웨어생성 시간기타 비디오 생성 모델VACE 는 다음과 같은 핵심 기능을 제공합니다.Reference-to-Video(R2V) : 참조 이미지로부터 비디오 생성Video-to-Video(V2V) : 기존의 비디오의 스타일 적용Masked Video Editing(MV2V): 각각의 프레임에서 지정한 영역을 인페인트 혹은 아웃페인트WAN VACE 모델은 ComfyUI에서 ..

Wan VACE R2V(참조 이미지로 비디오 생성하기)

Wan 2.1 VACE(Video All-in-one Creation and Editing)은 알리바바 팀이 개발한 비디오 생성/편집 모델입니다. 이 모델은 텍스트-비디오, 레퍼런스-비디오, 비디오-비디오(자세 및 depth), 인페인트, 아웃페인트 등을 모두 처리할 수 있는 통합 모델입니다.소프트웨어생성 시간기타 비디오 생성 모델VACE 는 다음과 같은 핵심 기능을 제공합니다.Reference-to-Video(R2V) : 참조 이미지로부터 비디오 생성Video-to-Video(V2V) : 기존의 비디오의 스타일 적용Masked Video Editing(MV2V): 각각의 프레임에서 지정한 영역을 인페인트 혹은 아웃페인트WAN VACE 모델은 ComfyUI에서 [WanVaceToVideo] 나 [Trim..

LTX Video 13B 를 ComfyUI에서 돌리는 방법

LTX Video는 생성 속도가 빠르고 VRAM 요구량이 낮으면서도 상대적으로 고품질의 비디오를 생성할 수 있는 모델입니다. LTX Video는 여러가지 모델이 있는데, 오늘 소개시켜드리는 LTXV-13B는 매개변수가 130억개로서 기존의 20억개의 모델에 비해 6배나 커졌습니다. 즉 이론적으로는 좀더 프롬프트를 잘 따르면서도 좋은 품질의 비디오를 생성할 수 있다는 것입니다.소프트웨어LTXV 13B 모델의 장점따라하기설정 변경TeaCache소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력하며, 현재 거의 대세로 자리잡고 있는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.LTXV 13B 모델의 장점LTXV 13B 모델은..

ComfyUI-TeaCache 사용방법

Flux, HiDream 등 새로운 이미지 생성형 인공지능들이 예전의 모델에 비해 매개변수 수가 커지면서 생성 시간이 늘어나고 있습니다. 물론 생성되는 이미지 품질이 가장 중요하지만, 생성속도도 무시할 수 없죠.그런데 품질에는 거의 영향을 미치지 않으면서도 디퓨전 모델의 생성 속도를 올릴 수 있는 방법이 있습니다. TeaCache를 사용하는 것입니다. TeaCache는 구현하기도 쉽고, 무엇보다 Flux와 Hunyuan Video와 같은 최신 이미지/비디오 생성모델에 적용할 수 있다는 장점이 있습니다.제 블로그에서는 예전에도 FLUX 용 TeaCache 및 Wan 2.1 용 TeaCache를 사용하여 생성 속도를 올리는 방법을 소개해 드린 적이 있습니다. 이 글에서는 2025년 5월말 현재 TeaCach..

구글 Whisk에서 고양이 비틀즈 생성하기

고양이 비틀즈가 Abbey Road를 건너가는 모습을 생성하려고, 여느 때처럼 구글 Image FX에 접속하자, 아래와 같이 새로운 실험 서비스인 Whisk를 사용해 보라는 알림이 떴습니다. 물론 바로 접속해서 생성을 시도했습니다.이 글에서는 이미지를 생성하고, 생성된 이미지를 다시 비디오로 생성하는 과정을 보여드립니다.이미지 생성비디오 생성짧은 감상이미지 생성맨 먼저 "의인화 고양이 Beatles가 Abbey road 횡단보도를 건너간다."라고 프롬프트를 주고 생성한 결과입니다. 두 장이 생성되는데, 그럴 듯한 것을 선택했습니다.이미지 좌측 위를 보면 애니메이션으로 바꾸는 기능과 세부 조정하는 기능이 있습니다. 일단 위의 이미지를 약간 수정하기로 하고 "세부 조정"을 눌렀습니다.그뒤, 고양이 품종을 다..

ChatGPT 를 사용하여 스타일 변경하기

요즘은 좀 시들해졌지만, 얼마전 ChatGPT-4o 가 등장했을 때 자신의 사진을 지브리 스타일로 변형하는 것이 유행했었습니다. 이 때문에 지브리 스튜디오와 OpenAI와 저작권 분쟁이 발생할 수 있다는 뉴스도 나왔었고요.이 글에서는 하나의 이미지를 사용해 여러가지 멋진 스타일을 생성하는 방법을 설명합니다. 아래는 예입니다.원리따라하기다른 스타일이미지가 생성되지 않을 경우원리ChatGPT는 GPT-4o와 같은 멀티모달 대형 언어모델(LLM, Large Language Model)을 사용하여, 여러가지 매체를 입력으로 받을 수 있습니다. GPT-4o는 텍스트 뿐만 아니라, 이미지, 오디오, 비디오 등을 입력으로 받아서, 텍스트, 이미지, 오디오를 생성합니다.따라하기이 내용을 따라하기 위해서는 ChatGPT..

ComfyUI에서 API 노드 사용하기

얼마전 ComfyUI에서 GPT-Image-1 API 사용하기라는 글을 올리면서, 다른 API도 사용할 수 있게 될지도 모른다고 말씀드렸는데, 드디어 그 해결책이 나왔습니다. ComfyUI 에서 GPT 뿐만 아니라, Veo2, Flux Ultra와 같이 API를 제공하는 서비스를 사용할 수 있는 API노드를 정식으로 제공하기 시작한 것입니다.API 노드란?지원 모델API 노드 사용법이미지/비디오 생성비용향후 추가 개발 사항API 노드란?API 노드는 ComfyUI에 새롭게 추가된 기본 노드로서, Veo2 또는 Flux Ultra와 같은 유료 모델의 API를 호출할 수 있는 노드입니다. 기본적으로 ComfyUI는 자신의 PC 에 저장된 모델을 사용하지만, 이미지 혹은 비디오 제작자 들은 무엇보다 품질이 우..

간단 3D 효과 비디오 생성 방법

이 워크플로는 이미지를 입력받아 아래 예제와 같이 3D 효과를 보여주는 비디오를 생성하는 워크플로입니다. 소프트웨어워크플로 작동 원리따라하기소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력하며, 현재 거의 대세로 자리잡고 있는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.워크플로 작동 원리이 워크플로의 중앙에는 이미지를 입력받아 먼저 Depth map을 생성하고, 이를 이 Depth map을 이용해 [Depthflow] 노드에서 3차원 비디오를 생성합니다. 그 아래쪽에는 여러가지 3D 효과 중에서 하나를 선택하는 부분입니다. Circle, Dolly 등 총 6가지 3D 효과가 있는데, [Preset Swith] 노드..

옛날 만화 스타일 변환하기

이 워크플로는 이미지를 입력받아 아주 오래된 만화 스타일로 변환해주는 워크플로입니다. 이 워크플로는 SDXL (정말 오랜만이네요) 모델과 Hoko Manga Style LoRA사용합니다.아래는 송혜교님 사진을 사용해 생성한 예입니다. 보시는 것처럼, 이 워크플로는 사용된 이미지의 고유한 특성은 거의 사라지고 만화 스타일만 나오는 한계가 있습니다. 또한 남자 사진을 넣어도 여자로 생성됩니다. ㅎㅎ소프트웨어워크플로 작동 원리따라하기소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력하며, 현재 거의 대세로 자리잡고 있는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.워크플로 작동 원리이 워크플로 전반부는 여러가지 모델을 불러들..