전체 글 1747

FreeU: 더 멋진 이미지

FreeU는 잡음 제거기를 수정하여 이미지 품질을 향상시키는 스테이블 디퓨전용 애드온(Addon)입니다. 이글에서는 FreeU의 작동 원리과 AUTOMATIC1111 및 ComfyUI 에서 적용하는 방식을 알아보겠습니다. 이 글의 목차는 아래와 같습니다. FreeU 란? FreeU의 효과 AUTOMATIC1111에서 FreeU 사용하기 ComfyUI에서 FreeU 사용하기 FreeU v1과 FreeU v2 의 차이 제 비교 및 생각 FreeU 란? FreeU란 스테이블 디퓨전의 U-Net 잡음 제거기를 수정하여, 이미지 생성 프로세스를 향상시키는 기법으로, Chenyang Si 등이 저술한 FreeU: Free Lunchj in Diffusion U-Net에서 기술되어 있습니다. Chenyang 은 이 ..

이미지 프롬프트 사용법

이미지 프롬프트를 사용하면 이미지를 프롬프트의 일부로 사용하여 출력 이미지의 구도, 스타일 및 색상에 영향을 줄 수 있습니다. 이 글에서는 이미지 프롬프트가 무엇인지 알아보고, 이미지 프롬프트를 사용하는 방법을 알아봅니다. 이 글의 목차는 아래와 같습니다. 소프트웨어 설정 이미지 프롬프트란? 이미지 프롬프트 사용법 이미지 프롬프트 적용 효과 변경 IP-Adapter plus SDXL 모델에서 IP-Adapter 사용방법 소프트웨어 설정 이 글에 있는 내용은 스테이블 디퓨전의 대표적인 UI인 AUTOMATIC1111을 사용합니다. 원래 구글 Colab 및 Mac에서도 설치할 수 있지만, 이 블로그에서는 윈도11에 설치하는 방법만 다룹니다. AUTOMATIC1111을 처음 접하시는 분은 초보자 가이드를 읽어..

Stable Video Diffusion(SVD) - 공식 img2vid

얼마전, Stable Diffusion을 오픈소스로 공개한 Stability.ai에서 텍스트 입력만으로 짧은 비디오(움짤)를 생성할 수 있는 Stable Video Diffusion을 공개했다는 소식을 알려드렸습니다(비디오 생성 스테이블 디퓨전 참조). 오늘은 이에 대한 좀 더 자세한 소식이 있어 소개합니다. 아래는 이 글에서 다루는 내용입니다. 비디오 스테이블 디퓨전(SVD) 이란? 비디오 스테이블 디퓨전(SVD) 모델 가중치 모델 파라미터 ComfyUI로 비디오 스테이블 디퓨전 사용하기(txt2vid) ComfyUI에서 이미지를 비디오로 변환하기(img2vid) ComfyUI에서 img2vid 사용하기 비디오 스테이블 디퓨전(SVD) 이란? Stable Video Diffusion(SVD, 비디오 생..

SDXL 터보 - 실시간 이미지 생성

SDXL 터보 모델은 단 한번의 샘플링 단계만에 선명한 이미지를 생성하는 미세조정(fine-tuned) 모델입니다. 이 글에서 다루는 내용은 다음과 같습니다. SDXL 터보란 AUTOMATIC1111에서 SDXL 터보 사용하는 방법 ComfyUI에서 SDXL 터보 사용하는 방법 실시간 프롬프트 처리(Real-time Prompting) SDXL Turbo를 위한 최적 설정 성능 비교 SDXL Turbo와 LCM-LoRA 비교 SDXL 터보란? SDXL 터보(Turbo) 모델은 단 한번의 샘플링 단계만에 선명한 이미지를 생성하도록 미세조정(fine-tuned)한 SDXL(스테이블 디퓨전 XL) 모델입니다. 학습방법 SDXL 터보 모델의 학습 방법은 Axel Sauer 등이 저술한 논문 "적대적 확산 농축(..

LCM-LoRA - 초고속 스테이블 디퓨전

LCM-LoRA를 사용하면 스테이블 디퓨전 모델을 사용한 이미지 생성 속도를 아주 빠르게 할 수 있습니다. 일반적인 경우 KSampler에서 20 단계 ~ 25 단계정도를 돌려야만 깔끔한 이미지를 생성할 수 있음에 비해, LCM-LoRA를 사용할 경우, 4-6 단계 정도면 비슷한 수준의 이미지를 생성할 수 있습니다. 즉 5배 정도 빨리 이미지를 생성할 수 있다는 것입니다. 또한 LCD-LoRA의 경우 SDXL에도 적용할 수 있어 유용할 것 같습니다. 특히 아래와 같은 AnimateDiff 비디오를 생성할 경우, 여러개의 프레임을 생성해야 하므로 속도가 매우 중요하다고 할 수 있습니다. 아래는 이 글의 목차입니다. LCM-LoRA란 무엇인가? LCM-LoRA의 작동 원리 LCM-LoRA 다운로드 AUTOM..

비디오 생성 스테이블 디퓨전(SVD, Stable Video Diffusion)

2023년 11월 21일, 스테이블 디퓨전 개발사인 Stability.AI에서 비디오를 생성할 수 있는 스테이블 디퓨전 모델인 Stable Video Diffusion을 공개했습니다. 현재는 IMG2VID, 즉 이미지를 입력하면 그 이미지를 14프레임 또는 25프레임의 짧은 비디오만 생성되는 수준으로서, 텍스트 입력이 불가능하니 움직임을 제어하는 것은 불가능한 상태입니다. 거의... AnimateDiff에서 지원하는 정도라고 보시면 될 것 같네요. 이마저도 연구용으로만 제공되며, Stability.ai에서 제공하는 공식 샘플 사이트라고 할 수 있는 ClipDrip에서도 지원을 하지 않기 때문에 일반 사용자들은 AUTOMATIC1111 이나 ComfyUI에서 지원될 때까지는 사용할 수 없을 것 같습니다. ..

Stable Diffusion - 인페인트에 대한 모든 것

스테이블 디퓨전을 사용해 인공지능 이미지를 생성하다보면 마음에 안드는 이미지도 많이 생성되기 마련입니다. 전체적으로 구도가 마음에 안든다면 버려야겠지만, 얼굴이나 옷 색깔과 같이 일부분만 마음에 안들 경우에는 인페인트 기능을 사용해 그 부분만 새로 그릴 수 있습니다. 이 글의 목차는 아래와 같습니다. 소프트웨어 설정 인페인트 기본 예제 인페인트의 원리 인페인트 매개변수 설정 인페인트 전용 모델 콘트롤넷 인페인트 자동 인페인트 SDXL 모델의 인페인트 ComfyUI에서의 인페인트 소프트웨어 설정 이 글에서는 스테이블 디퓨전 용 AUTOMATIC1111 웹UI를 사용합니다. 원래 Mac에서도 사용할 수 있고, 구글 Colab에도 설치할 수 있지만, 저는 윈도에서 설치하는 방법만 정리했습니다. 스테이블 디퓨전..

ComfyUI - 구역 분할 프롬프트

예전에 Stable Diffusion - 구역 분할 프롬프트 사용법이라는 글에서, AUTOMATIC11111을 사용할 때 프롬프트를 구역별로 다르게 지정하는 방법을 설명했습니다. 이 글은 ComfyUI에서 비슷한 방법을 구현하는 방법을 설명합니다. 참고로 여기에 포함된 이미지(캡처 이미지 제외)는 대부분 ComfyUI의 워크플로가 포함되어 있으므로, 다운로드 받아 ComfyUI 캔버스에 Drag&Drop 또는 메인 메뉴에서 [Load] 버튼으로 읽어들여 사용할 수 있습니다. 이 글에서 다루는 내용은 아래와 같습니다. 소프트웨어 설치 간단 예제: 좌우 분할 4분할 봄 여름 가을 겨울 Visual Area Conditioning 노드 4분할 봄여름가을 - Visual Area Conditioning 노드 소..

ComfyUI - Visual Area Conditioning 커스텀 노드

이 커스텀 노드를 사용해서 인공지능 이미지를 생성하기 위해서는 먼저 ComfyUI를 설치해야 합니다. ComfyUI 설치 및 간략한 사용방법은 이 글을 참고하세요. ComfyUI를 설치한 후에는 ComfyUI Manager 커스텀 노드를 설치하는 게 좋습니다. ComfyUI Manager 커스텀 노드 설치 방법은 이 글을 참고하세요. 이 글에서 다루는 내용은 아래와 같습니다. Visual Area Conditioning 커스텀 노드 설치 Visual Area Conditioning 커스텀 노드 사용법 Visual Area Conditioning 워크플로 Multi Latent Composite 커스텀 노드 사용법 Visual Area Conditioning 커스텀 노드 설치 커스텀 노드는 Github 주..

편리한 ComfyUI 워크플로 모음

ComfyUI 를 사용하면 워크플로를 아주 자유롭게 설정할 수 있습니다. 그냥 노드들의 위치를 원하는 대로 바꾸는 정도가 아니라, 아얘 다른 노드로 바꿔서 형태는 완전히 다르지만, 내용상으로는 완전히 동일한 워크플로를 만드는 것도 가능합니다. 그러다보니 (그 이외에도 여러가지 이유가 많지만) 형태가 거의 변하지 않는 AUTOMATIC1111과는 달리 ComfyUI는 사용하기 힘들다는 푸념이 나오기 마련입니다. 저도 처음엔 아주 힘들었고, 사용하기 시작한지 두어 달이 지난 지금도 잘 알지 못하는 부분이 많습니다. 그래도 지금은 그럭저럭 적응하고 있고, AUTOMATIC1111보다 ComfyUI를 사용하는 시간이 더 늘어나고 있는 편입니다. 아래는 제가 자주 사용하고 있는 워크플로 몇가지를 정리해봤습니다. ..

Stable Diffusion - HiRes. Fix를 활용한 고품질 이미지 생성

이 글에서는 HiRes Fix (High Resolution Fix, 고해상도 수정)이라는 기법을 소개합니다. 이 기법은 2 패스 Txt2Img 기법이라고도 하는데, txt2img 방식으로 저해상도 잠재 이미지를 생성한 후, 이 잠재 이미지를 확대하고 다시 img2img 방식으로 이미지를 생성하는 기법을 말합니다. 뭔가 여러번 단계를 거쳐야 해서 약간 복잡하기는 하지만, 그냥 이미지를 확대하는 것에 비해 매우 고품질의 이미지를 얻을 수 있는 장점이 있습니다. 먼저 결과물을 보여드리겠습니다. 아래 왼쪽은 그냥 txt2img로 생성한 이미지이고, 오른쪽은 HiRes. Fix 기법을 적용해 생성한 이미지입니다(이미지 크기가 다르지만 동일한 크기로 비교해봤습니다). 보시는 것처럼, 이미지 크기가 커진 것과는 별..

Efficiency Nodes for ComfyUI

얼마 전 ComfyUI를 이용해서 무한 줌 영상을 만드는 글에는 아래와 같이 [Efficient Loader] 노드와 [KSampler (Efficient)] 노드를 사용했습니다. 그 글에서는 자세하게 설명하지 않았지만, 아래에서 보시는 것처럼 [Efficient Loader] 노드는 체크포인트 모델, VAE, LoRA 모델, 프롬프트, 레이턴트 이미지 등 모델에 관련된 거의 대부분의 기능이 합쳐져 있는 노드입니다. 이 노드를 [KSmapler (Efficient)] 노드와 함께 사용하면 워크플로를 아주 깔끔하게 구성할 수 있어 편리한 듯합니다. 참고: 얼마전 Efficiency Node 를 관리하던 LucianoCirino님이 이 노드 관리를 포기하신다고 선언해서, jags111 님의 GitHub 사이..

AnimateDiff를 사용한 Vid2Vid - ComfyUI

이 글에서는 AnimateDiff Prompt Travel Video-to-video, 즉, AnimateDiff 와 프롬프트를 사용해서 기준 Video를 유사한 다른 비디오를 만드는 기법을 소개시켜드립니다. 이제까지 Stable Diffusion을 사용해서 비디오를 만드는 방법은 여러번 소개시켜드렸는데(다섯가지 방법, Deforum, AnimateDiff) 여러가지 한계가 있었습니다. 이 글에서 소개시켜 드리는 방법도 완벽하다고는 할 수 없지만, 상당히 부드럽고 일관성이 있는 비디오를 생성할 수 있는 기법입니다. 이 글의 목차는 아래와 같습니다. AnimateDiff Prompt Travel의 작동 원리 소프트웨어 설정 워크플로 불러오기 사용방법 생성된 영상 품질 검사 생성 설정 변경 좋은 영상을 만들..

이미지에서 프롬프트를 알아내는 방법

멋진 AI 이미지를 발견했을 때, 무슨 프롬프트로 생성했을까 궁금할 때가 있으실 겁니다. 이럴 때 프롬프트를 알아내는 방법을 몇가지 소개시켜드립니다. 또한 이미지를 재 생성할 확률을 높일 수 있는 몇가지 기법도 소개합니다. 이 글의 목차는 다음과 같습니다. 소프트웨어 설치 PNG 정보에서 프롬프트 알아내기 CLIP interrogator 사용하여 프롬프트 알아내기 AUTOMATIC1111 기본 CLIP interrogator 사용법 CLIP interrogator 확장 Huggingface 사이트 비슷한 이미지를 생성하기 위한 팁 소프트웨어 설치 이 블로그에서 다루는 AI 이미지 생성용 모델은 stable diffusion입니다. 하지만 이 모델은 사용하기 힘들기 때문에(python 프로그램을 돌려야 합..

ComfyUI를 위한 유용한 정보

스테이블 디퓨전으로 이미지를 생성하는 경우, 대부분 AUTOMATIC1111 웹UI를 사용합니다. 하지만, ComfyUI 는 훨씬 미세하게 조정할 수 있고, 스테이블 디퓨전의 자료처리 과정을 잘 이해할 수 있다는 점에서 나름 쓸만한 대안입니다. 게다가 사용해보면 아시겠지만, 훨씬 메모리를 덜 차지하고 속도가 빠릅니다. 저는 현재 AUTOMATIC1111을 사용하는 것이 편한 경우가 많아서 두가지 모두를 사용하고 있지만, 언젠가는 ComfyUI로 완전히 돌아서지 않을까 싶습니다. ComfyUI가 여러가지 장점이 있지만, 사용하기 쉽지 않다는 단점이 있습니다. 기능이 어딘가 숨겨져 있을텐데, 매뉴얼도 마땅치 않고... 그래서 제가 사용하면서 알게된 팁 몇가지를 공유합니다. 물론 제가 까먹지 않기 위한 목적이..