전체 글 1864

Hunyuan video LoRA

LoRA(Low-Rank Adaptation)은 Flux나 Stable Diffusion과 같은 이미지 모델을 세부 조정(finetuning)하는 기술로서 탄생했습니다. 모델 매개변수 일부를 조정하는 것에 초점을 맞춤으로써, LoRA는 전체 모델을 다시 학습할 필요 없이 효과적으로 미세조정을 할 수 있습니다.그런데, 대형 비디오 모델로서는 처음으로, Hunyuan Video 에서 LoRA를 사용할 수 있게 되었습니다.이번 글에서는 Hunyuan Video에 LoRA를 사용하는 방법을 알려드립니다. 이 기법에는 여러개의 LoRA를 사용하여 아래와 같은 장면에서 일관성있는 캐릭터를 생성할 수 있습니다.소프트웨어Hunyuan LoRA의 작동 원리사용 사례하나의 LoRA를 사용하는 워크플로두 개의 LoRA를 사..

ComfyUI로 이미지 마스크 생성하기

이미지 마스크는 그래픽 디자인에서 고급 컴퓨터 비전까지 다양한 분야에서 매우 중요합니다. 크리에이턷들은 이미지 마스크를 사용하여 문맥상의 무결성을 유지하고 다운스트림 워크플로에서 혁신적인 가능성을 열 수 있습니다.이 워크플로에서는 프롬프트를 사용하여 자동적으로 마스크를 생성할 수 있습니다. 예를 들어, 아래의 예에서 "bottle"이라고 프롬프트를 입력하면 마스크와 역 마스크를 얻을 수 있습니다.소프트웨어워크플로 개요따라하기소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.워크플로 개요이 워크플로는 Grounding DINO와 Segment Anything 모델을 ..

ComfyUI로 이미지 배경 삭제하기

배경 제거는 디지털 아티스트 및 그래픽 디자이너에게 중요한 도구입니다. 군더더기를 줄이고 집중력을 높일 수 있죠. 또한 이 이미지를 다양한 맥락에 재활용할 수 있습니다.이 글에서는 ComfyUI를 사용해 이미지 배경을 삭제하는 방법을 설명합니다.소프트웨어다른 대안따라하기소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.다른 대안사실 구글링만 해봐도 배경을 삭제하는 서비스는 많습니다. 하지만, 처리된 이미지를 원래의 해상도로 다운로드 받으려면 가입을 하거나 비용을 지불하는 경우가 많습니다. 또한 프라이버시 혹은 비밀 등으로 인해 이러한 서비스를 이용하는 것이 타당하지..

Hunyuan 비디오를 이미지와 함께 사용하기

Hunyuan video는 텍스트 설명을 비디오로 바꾸어주는 비디오 모델입니다. 하지만 이미지를 비디오로 바꾸려면 어떻게 해야 할까요? 해답은 Image-to-video 모델입니다만, 아쉽게도 Hunyuan은 아직 공개하지 않고 있습니다. 만약 나온다면 일약 게임 체인저가 될텐데요. 당분간은 Image Prompt를 사용해 비디오를 제작하는 IP2V 를 사용해 비슷한 효과를 얻어야 합니다.이 워크플로는 이미지와 프롬프트를 입력받아 비디오를 생성합니다. 예를 들어, 배경이미지를 제공하고 프롬프트로 사람을 추가하면 아래와 같은 이미지를 생성할 수 있습니다.소프트웨어작동 원리Img2Vid와 IP2V의 차이유즈케이스따라하기이미지 프롬프트 조정소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하..

Hunyuan Video 사용방법 (ComfyUI)

Hunyuan 비디오는 놀라움 품질의 비디오를 생성할 수 있는, 자신의 PC에서 돌릴 수 있는 새로운 오픈소스 비디오 모델입니다. 텍스트 프롬프트를 입력하면 몇 분만에 짧은 비디오 클립을 생성할 수 있습니다. 비디오에 B-roll(보조 영상)을 삽입하고자 하는 유튜버와 같은 크리에이터에게 필수라고 할 수 있을 것 같습니다.아래는 Hunyuan Video의 예입니다.A panda riding a motorcycle in a busy New York City street, camera zooms out.이 글에서는 Hunyuan Video를 사용하여, Text-to-Video 및 Image-to-Video 모드로 비디오를 생성하는 방법을 설명합니다.소프트웨어Hunyuan Video의 원리생성 시간하드웨어 요..

LTX 비디오

LTX Studio, Facetune, Videoleap 등의 앱을 개발한 Lightricks가 최초의 비디오 생성 모델인 LTX Video 0.9를 공개했습니다. 이 모델은 오픈소스이며, 5초짜리 AI 비디오를 단 4초만에 생성할 수 있다고 주장하고 있습니다.LTX는  5초짜리 768x512 해상도 (24 fps)의 비디오를 단 4초만에 생성할 수 있는 "실시간 비디오 생성기"라고 주장합니다. 여기에 사용된 하드웨어는 Nvidia H100 GPU를 사용했는데,  RTX4090의 경우엔 4초짜리 비디오를 10초 이내에 생성할 수 있습니다. RTX 3070의 경우에는 약 50초 정도 소요되고요.LTX  모델은 이 디퓨전 트랜스포머(DiT) 아키텍처를 사용하며, 모델의 크기가 20 억개로 작아서, 6 GB ..

춤추는 스파게티

어떤 물체를 춤추게 한다는 아이디어를 생각해 본 적이 있으신가요? 이 글에 있는 ComfyUI 워크플로를 사용하면 쉽게 생성할 수 있습니다 이 예제 워크플로는 댄싱 비디오를 춤추는 스파게티로 전환해 줍니다.소프트웨어이 워크플로의 원리따라하기비디오 변경소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.이 워크플로의 원리이와 비슷한 작업을 두개의 샘플링 패스로 구현한 사례가 있지만, 이는 불필요합니다. 여기서는 단일 샘플링 패스를 사용해 동일한 결과를 얻는 방법을 보여드리겠습니다 입력 비디오는 흰색 피사체와 검은색 배경으로 이루어집니다. 이러한 비디오는 Depth 전처..

페이스 아트 애니메이션

이 글에서는 아래와 같은 페이스 아트 애니메이션 비디오를 생성합니다.소프트웨어이 워크플로의 원리따라하기비디오 변경소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.이 워크플로의 원리참조 이미지 생성이 워크플로에서는 먼저 SDXL 모델과 loRA를 사용해서 비디오를 생성하기 위한 참조 이미지를 생성합니다.비디오 생성비디오는 SD 1.5 모델에 AnimateDiff 를 적용하여 생성합니다. 비디오 생성 도중에 IP adapter를 사용하여 참조 이미지를 주입합니다. 여기에서 프롬프트는 비워두어서 오직 이미지를 기준으로만 비디오를 생성하게 됩니다.후처리스테이블 디퓨전을 ..

Animate 스타일 모핑 비디오

이 워크플로는 4가지 스타일의 인물 이미지를 모핑하는 비디오를 생성합니다. 아래는 예시입니다. 스타일은 텍스트 프롬프트로 설정합니다. 따라서 원하는 프롬프트를 넣으면 스타일을 변경할 수 있습니다. 또한 변환 패턴도 조절할 수 있습니다.소프트웨어이 워크플로의 원리따라하기비디오 변경소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.이 워크플로의 원리개요모핑 비디오는 AnimateDiff 를 이용해서 프레임간의 일관성을 유지합니다. 이 워크플로에서는 아래와 같이 4개의 참조 이미지를 사용하는데, 각각 1/4 간격으로 비디오에 삽입합니다. 이 4장의 비디오는 SDXL 모델..

ComfyUI에서 스테이블 디퓨전 3.5 미디엄 모델 사용하기

스테이블 디퓨전 3.5 미디엄(Stable Diffusion 3.5 Medium)은 일반용 그래픽카드에서 돌릴 수 있는 AI 이미지 모델입니다. 파라미터의 수는 26개로서, 8억개인 SD 3.5 Large에 비해 적습니다.SD 3.5 미디엄은 메모리가 큰 GPU에서 이미지를 빨리 생성하고 싶은 경우, 혹은 메모리가 비교적 작은 PC에서 돌리고자 할 경우에 사용할 수 있습니다. Stablility AI에 따르면 256x256 부터 1440x1440 에 이르는 여러 해상도를 지원하는 최초의 스테이블 디퓨전 모델이라고 합니다. 소프트웨어SD 3.5 모델SD 3.5 미디엄 설치 방법SD 3.5 미디엄 모델 설정소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하는 ComfyUI를 사용합니다. ..

백라이트 사진

이 워크플로는 초보자용으로서, SD-Forge 웹UI에 Flux 모델을 사용하여 사실적인 백라이트 사진을 생성하는 워크플로입니다.소프트웨어따라하기이미지 변형소프트웨어이 투토리얼에서는 Stable Diffusion Forge 웹 UI를 사용합니다. 설치 방법은 여기를 보시고, Forge에서 Flux를 실행시키는 방법은 여기를 읽어보세요.따라하기1 단계: 체크포인트 모델 설치아래의 모델을 다운로드 받습니다.Flux1 dev NF4 - VRAM이 적은 기기에서 돌릴 수 있는 작지만 빠른 버전(6GB/8GB/12GB 등)다운로드 받은 후 webui_forge_cuXXX_torchXXX/webui/models/Stable-diffusion 폴더에 넣어줍니다. AUTOMATIC1111과 모델을 공유할 경우, sta..

천사의 패션쇼

이 글은 아래의 비디오를 생성하는 따라하기 워크플로를 소개합니다.소프트웨어따라하기소프트웨어이글에서는 SD Forge 웹UI에서 Flux AI 모델을 사용하여 이미지를 생성하고, 이 이미지를 사용하여 Kling AI 서비스를 이용해 고품질 비디오로 전환합니다. 따라하기1단계: 소프트웨어 준비VRAM이 적은 PC에서 Flux AI 실행시키기에 따라 소프트웨어 및 Flux1 dev NF4 모델을 준비합니다. 2단계: 이미지 생성SD Forge 웹UI를 열과 아래와 같이 설정합니다.UI: fluxCheckpoint: flux1-dev-bnb-nf4-v2.safetensors프롬프트: An angel with large wings, blonde, exquisite clothes walking on a catwal..

Flux AI 개요

2024년 8월 1일 Flux. 1 이 출시된 이래, 이와 관련된 여러가지 활동이 이루어지고 있습니다. 많은 사람들이 사용방법을 알아내고, 이를 돌리기 위한 도구를 만들기 위해 노력해 왔습니다. 이제 조금 정리되었으므로, Flux의 도구와 자원을 정리해볼 때입니다.Flux AI 모델이란?Flux AI 모델의 작동 원리Flux AI 모델을 상업적으로 사용할 수 있나?Flux AI 모델 사용 방법Flux AI 로 야한 이미지를 생성할 수 있나?Flux와 스테이블 디퓨전의 차이Flux AI 모델이란?Flux AI 모델은 Black Forest Labs에서 개발되었으며, 사실적인 이미지를 생성하는데 뛰어난 이미지 생성용 인공지능 모델입니다. Flux AI 모델은 아래와 같은 세가지 모델이 존재합니다.Flux.1..

AnimateDiff 모핑 비디오(ComfyUI)

이 워크플로는 아래와 같은 모핑(morphing) 비디오를 생성합니다. (모핑이란 하나의 형체가 전혀 다른 이미지로 변화하는 기법을 말합니다. 위키 참조) 프롬프트를 사용해 각각의 이미지를 미세하게 조정할 수도 있고, 변환 패턴도 조정할 수 있습니다. 소프트웨어이 워크플로의 원리따라하기비디오 변경소프트웨어이 글에서는 노드 기반의 스테이블 디퓨전 GUI인 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법과 초보가이드를 확인하시기 바랍니다. 이 워크플로의 원리개요모핑 비디오는 AnimateDiff 를 이용해서 프레임간의 일관성을 유지합니다. 이 워크플로에서는 아래와 같이 4개의 참조 이미지를 사용하는데, 각각 1/4 간격으로 비디오에 삽입합니다. 이 4장의 비디오는 SDXL ..

SDXL 모델과 Flux1.dev 모델 비교

SDXL 과 Flux1.dev는 인공지능 이미지 모델중 가장 유명한 두가지 모델입니다. 둘다 1024x1024 급의 고해상도 이미지 생성을 지원합니다. 현재 시점으로는 SDXL 쪽이 더 많은 자원(모델 학습용 도구, ControlNet이나 LoRA 등)이 존재하지만, 아마도 근시일 내로 Flux 모델도 보완될 것이라고 보입니다.그러면 SDXL 모델은 지워버리고 Flux로 갈아타야 할까요? 이 글에서는 SDXL과 Flux1.dev 모델의 장단점을 비교해 보겠습니다.소프트웨어생성 속도텍스트 생성프롬프트 이해도자세 제어물체의 배치손 렌더링얼굴스타일결론소프트웨어이 글에서는 SD Forge 웹UI를 사용하여 이미지를 비교해 보겠습니다. 아래는 사용할 체크포인트 모델이빈다.SDXL 1.0 모델Flux1 Dev NF..