전체보기 1901

Hunyuan 비디오를 이미지와 함께 사용하기

Hunyuan video는 텍스트 설명을 비디오로 바꾸어주는 비디오 모델입니다. 하지만 이미지를 비디오로 바꾸려면 어떻게 해야 할까요? 해답은 Image-to-video 모델입니다만, 아쉽게도 Hunyuan은 아직 공개하지 않고 있습니다. 만약 나온다면 일약 게임 체인저가 될텐데요. 당분간은 Image Prompt를 사용해 비디오를 제작하는 IP2V 를 사용해 비슷한 효과를 얻어야 합니다.이 워크플로는 이미지와 프롬프트를 입력받아 비디오를 생성합니다. 예를 들어, 배경이미지를 제공하고 프롬프트로 사람을 추가하면 아래와 같은 이미지를 생성할 수 있습니다.소프트웨어작동 원리Img2Vid와 IP2V의 차이유즈케이스따라하기이미지 프롬프트 조정소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하..

Hunyuan Video 사용방법 (ComfyUI)

Hunyuan 비디오는 놀라움 품질의 비디오를 생성할 수 있는, 자신의 PC에서 돌릴 수 있는 새로운 오픈소스 비디오 모델입니다. 텍스트 프롬프트를 입력하면 몇 분만에 짧은 비디오 클립을 생성할 수 있습니다. 비디오에 B-roll(보조 영상)을 삽입하고자 하는 유튜버와 같은 크리에이터에게 필수라고 할 수 있을 것 같습니다.아래는 Hunyuan Video의 예입니다.A panda riding a motorcycle in a busy New York City street, camera zooms out.이 글에서는 Hunyuan Video를 사용하여, Text-to-Video 및 Image-to-Video 모드로 비디오를 생성하는 방법을 설명합니다.소프트웨어Hunyuan Video의 원리생성 시간하드웨어 요..

LTX 비디오

LTX Studio, Facetune, Videoleap 등의 앱을 개발한 Lightricks가 최초의 비디오 생성 모델인 LTX Video 0.9를 공개했습니다. 이 모델은 오픈소스이며, 5초짜리 AI 비디오를 단 4초만에 생성할 수 있다고 주장하고 있습니다.LTX는  5초짜리 768x512 해상도 (24 fps)의 비디오를 단 4초만에 생성할 수 있는 "실시간 비디오 생성기"라고 주장합니다. 여기에 사용된 하드웨어는 Nvidia H100 GPU를 사용했는데,  RTX4090의 경우엔 4초짜리 비디오를 10초 이내에 생성할 수 있습니다. RTX 3070의 경우에는 약 50초 정도 소요되고요.LTX  모델은 이 디퓨전 트랜스포머(DiT) 아키텍처를 사용하며, 모델의 크기가 20 억개로 작아서, 6 GB ..

춤추는 스파게티

어떤 물체를 춤추게 한다는 아이디어를 생각해 본 적이 있으신가요? 이 글에 있는 ComfyUI 워크플로를 사용하면 쉽게 생성할 수 있습니다 이 예제 워크플로는 댄싱 비디오를 춤추는 스파게티로 전환해 줍니다.소프트웨어이 워크플로의 원리따라하기비디오 변경소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.이 워크플로의 원리이와 비슷한 작업을 두개의 샘플링 패스로 구현한 사례가 있지만, 이는 불필요합니다. 여기서는 단일 샘플링 패스를 사용해 동일한 결과를 얻는 방법을 보여드리겠습니다 입력 비디오는 흰색 피사체와 검은색 배경으로 이루어집니다. 이러한 비디오는 Depth 전처..

페이스 아트 애니메이션

이 글에서는 아래와 같은 페이스 아트 애니메이션 비디오를 생성합니다.소프트웨어이 워크플로의 원리따라하기비디오 변경소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.이 워크플로의 원리참조 이미지 생성이 워크플로에서는 먼저 SDXL 모델과 loRA를 사용해서 비디오를 생성하기 위한 참조 이미지를 생성합니다.비디오 생성비디오는 SD 1.5 모델에 AnimateDiff 를 적용하여 생성합니다. 비디오 생성 도중에 IP adapter를 사용하여 참조 이미지를 주입합니다. 여기에서 프롬프트는 비워두어서 오직 이미지를 기준으로만 비디오를 생성하게 됩니다.후처리스테이블 디퓨전을 ..

Animate 스타일 모핑 비디오

이 워크플로는 4가지 스타일의 인물 이미지를 모핑하는 비디오를 생성합니다. 아래는 예시입니다. 스타일은 텍스트 프롬프트로 설정합니다. 따라서 원하는 프롬프트를 넣으면 스타일을 변경할 수 있습니다. 또한 변환 패턴도 조절할 수 있습니다.소프트웨어이 워크플로의 원리따라하기비디오 변경소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.이 워크플로의 원리개요모핑 비디오는 AnimateDiff 를 이용해서 프레임간의 일관성을 유지합니다. 이 워크플로에서는 아래와 같이 4개의 참조 이미지를 사용하는데, 각각 1/4 간격으로 비디오에 삽입합니다. 이 4장의 비디오는 SDXL 모델..

ComfyUI에서 스테이블 디퓨전 3.5 미디엄 모델 사용하기

스테이블 디퓨전 3.5 미디엄(Stable Diffusion 3.5 Medium)은 일반용 그래픽카드에서 돌릴 수 있는 AI 이미지 모델입니다. 파라미터의 수는 26개로서, 8억개인 SD 3.5 Large에 비해 적습니다.SD 3.5 미디엄은 메모리가 큰 GPU에서 이미지를 빨리 생성하고 싶은 경우, 혹은 메모리가 비교적 작은 PC에서 돌리고자 할 경우에 사용할 수 있습니다. Stablility AI에 따르면 256x256 부터 1440x1440 에 이르는 여러 해상도를 지원하는 최초의 스테이블 디퓨전 모델이라고 합니다. 소프트웨어SD 3.5 모델SD 3.5 미디엄 설치 방법SD 3.5 미디엄 모델 설정소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하는 ComfyUI를 사용합니다. ..

백라이트 사진

이 워크플로는 초보자용으로서, SD-Forge 웹UI에 Flux 모델을 사용하여 사실적인 백라이트 사진을 생성하는 워크플로입니다.소프트웨어따라하기이미지 변형소프트웨어이 투토리얼에서는 Stable Diffusion Forge 웹 UI를 사용합니다. 설치 방법은 여기를 보시고, Forge에서 Flux를 실행시키는 방법은 여기를 읽어보세요.따라하기1 단계: 체크포인트 모델 설치아래의 모델을 다운로드 받습니다.Flux1 dev NF4 - VRAM이 적은 기기에서 돌릴 수 있는 작지만 빠른 버전(6GB/8GB/12GB 등)다운로드 받은 후 webui_forge_cuXXX_torchXXX/webui/models/Stable-diffusion 폴더에 넣어줍니다. AUTOMATIC1111과 모델을 공유할 경우, sta..

천사의 패션쇼

이 글은 아래의 비디오를 생성하는 따라하기 워크플로를 소개합니다.소프트웨어따라하기소프트웨어이글에서는 SD Forge 웹UI에서 Flux AI 모델을 사용하여 이미지를 생성하고, 이 이미지를 사용하여 Kling AI 서비스를 이용해 고품질 비디오로 전환합니다. 따라하기1단계: 소프트웨어 준비VRAM이 적은 PC에서 Flux AI 실행시키기에 따라 소프트웨어 및 Flux1 dev NF4 모델을 준비합니다. 2단계: 이미지 생성SD Forge 웹UI를 열과 아래와 같이 설정합니다.UI: fluxCheckpoint: flux1-dev-bnb-nf4-v2.safetensors프롬프트: An angel with large wings, blonde, exquisite clothes walking on a catwal..

Flux AI 개요

2024년 8월 1일 Flux. 1 이 출시된 이래, 이와 관련된 여러가지 활동이 이루어지고 있습니다. 많은 사람들이 사용방법을 알아내고, 이를 돌리기 위한 도구를 만들기 위해 노력해 왔습니다. 이제 조금 정리되었으므로, Flux의 도구와 자원을 정리해볼 때입니다.Flux AI 모델이란?Flux AI 모델의 작동 원리Flux AI 모델을 상업적으로 사용할 수 있나?Flux AI 모델 사용 방법Flux AI 로 야한 이미지를 생성할 수 있나?Flux와 스테이블 디퓨전의 차이Flux AI 모델이란?Flux AI 모델은 Black Forest Labs에서 개발되었으며, 사실적인 이미지를 생성하는데 뛰어난 이미지 생성용 인공지능 모델입니다. Flux AI 모델은 아래와 같은 세가지 모델이 존재합니다.Flux.1..