전체 글 1728

LCM-LoRA - 초고속 스테이블 디퓨전

LCM-LoRA를 사용하면 스테이블 디퓨전 모델을 사용한 이미지 생성 속도를 아주 빠르게 할 수 있습니다. 일반적인 경우 KSampler에서 20 단계 ~ 25 단계정도를 돌려야만 깔끔한 이미지를 생성할 수 있음에 비해, LCM-LoRA를 사용할 경우, 4-6 단계 정도면 비슷한 수준의 이미지를 생성할 수 있습니다. 즉 5배 정도 빨리 이미지를 생성할 수 있다는 것입니다. 또한 LCD-LoRA의 경우 SDXL에도 적용할 수 있어 유용할 것 같습니다. 특히 아래와 같은 AnimateDiff 비디오를 생성할 경우, 여러개의 프레임을 생성해야 하므로 속도가 매우 중요하다고 할 수 있습니다. 아래는 이 글의 목차입니다. LCM-LoRA란 무엇인가? LCM-LoRA의 작동 원리 LCM-LoRA 다운로드 AUTOM..

비디오 생성 스테이블 디퓨전

2023년 11월 21일, 스테이블 디퓨전 개발사인 Stability.AI에서 비디오를 생성할 수 있는 스테이블 디퓨전 모델인 Stable Video Diffusion을 공개했습니다. 현재는 IMG2VID, 즉 이미지를 입력하면 그 이미지를 14프레임 또는 25프레임의 짧은 비디오만 생성되는 수준으로서, 텍스트 입력이 불가능하니 움직임을 제어하는 것은 불가능한 상태입니다. 거의... AnimateDiff에서 지원하는 정도라고 보시면 될 것 같네요. 이마저도 연구용으로만 제공되며, Stability.ai에서 제공하는 공식 샘플 사이트라고 할 수 있는 ClipDrip에서도 지원을 하지 않기 때문에 일반 사용자들은 AUTOMATIC1111 이나 ComfyUI에서 지원될 때까지는 사용할 수 없을 것 같습니다. ..

Stable Diffusion - 인페인트에 대한 모든 것

스테이블 디퓨전을 사용해 인공지능 이미지를 생성하다보면 마음에 안드는 이미지도 많이 생성되기 마련입니다. 전체적으로 구도가 마음에 안든다면 버려야겠지만, 얼굴이나 옷 색깔과 같이 일부분만 마음에 안들 경우에는 인페인트 기능을 사용해 그 부분만 새로 그릴 수 있습니다. 이 글의 목차는 아래와 같습니다. 소프트웨어 설정 인페인트 기본 예제 인페인트의 원리 인페인트 매개변수 설정 인페인트 전용 모델 콘트롤넷 인페인트 자동 인페인트 SDXL 모델의 인페인트 ComfyUI에서의 인페인트 소프트웨어 설정 이 글에서는 스테이블 디퓨전 용 AUTOMATIC1111 웹UI를 사용합니다. 원래 Mac에서도 사용할 수 있고, 구글 Colab에도 설치할 수 있지만, 저는 윈도에서 설치하는 방법만 정리했습니다. 스테이블 디퓨전..

ComfyUI - 구역 분할 프롬프트

예전에 Stable Diffusion - 구역 분할 프롬프트 사용법이라는 글에서, AUTOMATIC11111을 사용할 때 프롬프트를 구역별로 다르게 지정하는 방법을 설명했습니다. 이 글은 ComfyUI에서 비슷한 방법을 구현하는 방법을 설명합니다. 참고로 여기에 포함된 이미지(캡처 이미지 제외)는 대부분 ComfyUI의 워크플로가 포함되어 있으므로, 다운로드 받아 ComfyUI 캔버스에 Drag&Drop 또는 메인 메뉴에서 [Load] 버튼으로 읽어들여 사용할 수 있습니다. 이 글에서 다루는 내용은 아래와 같습니다. 소프트웨어 설치 간단 예제: 좌우 분할 4분할 봄 여름 가을 겨울 Visual Area Conditioning 노드 4분할 봄여름가을 - Visual Area Conditioning 노드 소..

ComfyUI - Visual Area Conditioning 커스텀 노드

이 커스텀 노드를 사용해서 인공지능 이미지를 생성하기 위해서는 먼저 ComfyUI를 설치해야 합니다. ComfyUI 설치 및 간략한 사용방법은 이 글을 참고하세요. ComfyUI를 설치한 후에는 ComfyUI Manager 커스텀 노드를 설치하는 게 좋습니다. ComfyUI Manager 커스텀 노드 설치 방법은 이 글을 참고하세요. 이 글에서 다루는 내용은 아래와 같습니다. Visual Area Conditioning 커스텀 노드 설치 Visual Area Conditioning 커스텀 노드 사용법 Visual Area Conditioning 워크플로 Multi Latent Composite 커스텀 노드 사용법 Visual Area Conditioning 커스텀 노드 설치 커스텀 노드는 Github 주..

편리한 ComfyUI 워크플로 모음

ComfyUI 를 사용하면 워크플로를 아주 자유롭게 설정할 수 있습니다. 그냥 노드들의 위치를 원하는 대로 바꾸는 정도가 아니라, 아얘 다른 노드로 바꿔서 형태는 완전히 다르지만, 내용상으로는 완전히 동일한 워크플로를 만드는 것도 가능합니다. 그러다보니 (그 이외에도 여러가지 이유가 많지만) 형태가 거의 변하지 않는 AUTOMATIC1111과는 달리 ComfyUI는 사용하기 힘들다는 푸념이 나오기 마련입니다. 저도 처음엔 아주 힘들었고, 사용하기 시작한지 두어 달이 지난 지금도 잘 알지 못하는 부분이 많습니다. 그래도 지금은 그럭저럭 적응하고 있고, AUTOMATIC1111보다 ComfyUI를 사용하는 시간이 더 늘어나고 있는 편입니다. 아래는 제가 자주 사용하고 있는 워크플로 몇가지를 정리해봤습니다. ..

Stable Diffusion - HiRes. Fix를 활용한 고품질 이미지 생성

이 글에서는 HiRes Fix (High Resolution Fix, 고해상도 수정)이라는 기법을 소개합니다. 이 기법은 2 패스 Txt2Img 기법이라고도 하는데, txt2img 방식으로 저해상도 잠재 이미지를 생성한 후, 이 잠재 이미지를 확대하고 다시 img2img 방식으로 이미지를 생성하는 기법을 말합니다. 뭔가 여러번 단계를 거쳐야 해서 약간 복잡하기는 하지만, 그냥 이미지를 확대하는 것에 비해 매우 고품질의 이미지를 얻을 수 있는 장점이 있습니다. 먼저 결과물을 보여드리겠습니다. 아래 왼쪽은 그냥 txt2img로 생성한 이미지이고, 오른쪽은 HiRes. Fix 기법을 적용해 생성한 이미지입니다(이미지 크기가 다르지만 동일한 크기로 비교해봤습니다). 보시는 것처럼, 이미지 크기가 커진 것과는 별..

Efficiency Nodes for ComfyUI

얼마 전 ComfyUI를 이용해서 무한 줌 영상을 만드는 글에는 아래와 같이 [Efficient Loader] 노드와 [KSampler (Efficient)] 노드를 사용했습니다. 그 글에서는 자세하게 설명하지 않았지만, 아래에서 보시는 것처럼 [Efficient Loader] 노드는 체크포인트 모델, VAE, LoRA 모델, 프롬프트, 레이턴트 이미지 등 모델에 관련된 거의 대부분의 기능이 합쳐져 있는 노드입니다. 이 노드를 [KSmapler (Efficient)] 노드와 함께 사용하면 워크플로를 아주 깔끔하게 구성할 수 있어 편리한 듯합니다. 참고: 얼마전 Efficiency Node 를 관리하던 LucianoCirino님이 이 노드 관리를 포기하신다고 선언해서, jags111 님의 GitHub 사이..

AnimateDiff를 사용한 Vid2Vid - ComfyUI

이 글에서는 AnimateDiff Prompt Travel Video-to-video, 즉, AnimateDiff 와 프롬프트를 사용해서 기준 Video를 유사한 다른 비디오를 만드는 기법을 소개시켜드립니다. 이제까지 Stable Diffusion을 사용해서 비디오를 만드는 방법은 여러번 소개시켜드렸는데(다섯가지 방법, Deforum, AnimateDiff) 여러가지 한계가 있었습니다. 이 글에서 소개시켜 드리는 방법도 완벽하다고는 할 수 없지만, 상당히 부드럽고 일관성이 있는 비디오를 생성할 수 있는 기법입니다. 이 글의 목차는 아래와 같습니다. AnimateDiff Prompt Travel의 작동 원리 소프트웨어 설정 워크플로 불러오기 사용방법 생성된 영상 품질 검사 생성 설정 변경 좋은 영상을 만들..

이미지에서 프롬프트를 알아내는 방법

멋진 AI 이미지를 발견했을 때, 무슨 프롬프트로 생성했을까 궁금할 때가 있으실 겁니다. 이럴 때 프롬프트를 알아내는 방법을 몇가지 소개시켜드립니다. 또한 이미지를 재 생성할 확률을 높일 수 있는 몇가지 기법도 소개합니다. 이 글의 목차는 다음과 같습니다. 소프트웨어 설치 PNG 정보에서 프롬프트 알아내기 CLIP interrogator 사용하여 프롬프트 알아내기 AUTOMATIC1111 기본 CLIP interrogator 사용법 CLIP interrogator 확장 Huggingface 사이트 비슷한 이미지를 생성하기 위한 팁 소프트웨어 설치 이 블로그에서 다루는 AI 이미지 생성용 모델은 stable diffusion입니다. 하지만 이 모델은 사용하기 힘들기 때문에(python 프로그램을 돌려야 합..

ComfyUI를 위한 유용한 정보

스테이블 디퓨전으로 이미지를 생성하는 경우, 대부분 AUTOMATIC1111 웹UI를 사용합니다. 하지만, ComfyUI 는 훨씬 미세하게 조정할 수 있고, 스테이블 디퓨전의 자료처리 과정을 잘 이해할 수 있다는 점에서 나름 쓸만한 대안입니다. 게다가 사용해보면 아시겠지만, 훨씬 메모리를 덜 차지하고 속도가 빠릅니다. 저는 현재 AUTOMATIC1111을 사용하는 것이 편한 경우가 많아서 두가지 모두를 사용하고 있지만, 언젠가는 ComfyUI로 완전히 돌아서지 않을까 싶습니다. ComfyUI가 여러가지 장점이 있지만, 사용하기 쉽지 않다는 단점이 있습니다. 기능이 어딘가 숨겨져 있을텐데, 매뉴얼도 마땅치 않고... 그래서 제가 사용하면서 알게된 팁 몇가지를 공유합니다. 물론 제가 까먹지 않기 위한 목적이..

스테이블 디퓨전 QR Code 이미지 - ComfyUI

얼마 전 AUTOMATIC1111 웹UI에서 QR 코드를 만들고 로고 이미지를 넣는 방법을 소개해 드렸습니다. 간단히 요약하면 QR코드용으로 학습된 ControlNet 모델을 사용해서 QR코드 혹은 기타 이미지를 넣는 방법이었습니다. 오늘은 ComfyUI 웹 UI에서 이와 유사한 작업을 하는 방법을 소개시켜 드립니다. 이 글에서 다루는 내용은 아래와 같습니다. ComfyQR 커스톰 노드 설치 QR 코드용 ControlNet 모델 설치 QR 코드 ControlNet 노드 추가 QR Code 확인용 노드 추가 여러가지 QR Code 워크플로 자세한 원리는 별로 관심이 없고 그냥 사용하고만 싶다면 맨아래에 있는 QR Code 워크플로만 따라하시면 됩니다. ComfyQR 커스톰 노드 설치 ComfyUI Mana..

로고가 새겨진 이미지 만들기 - AUTOMATIC1111

먼저 아래 이미지를 보시죠. 큰 그림일 때는 잘 모르실 수도 있는데, 축소해서 보시면 잘 보이실 겁니다(Control 키를 누른 상태로 마우스 휠을 굴리면 화면을 축소/확대시킬 수 있습니다). 맞습니다. 맥도널드 로고가 새겨져 있습니다. 하나 더 보여드리겠습니다. 이 글에서는 이런 이미지를 생성할 수 있는 방법을 설명합니다. 이 글의 목차는 아래와 같습니다. 설치 QR Code 만들기 Logo가 들어간 이미지 만들기 다른 예제 설치 이 글에서 설명하는 내용을 실습해 보시려면 먼저 AUTOMATIC1111 을 설치해야 합니다. 여러가지 방법이 있지만, 윈도 환경에서 설치하는 방법은 여기를 보시면 됩니다. AUTOMATIC1111을 설치한 후에는 ControlNet 확장을 설치해야 합니다. ControlNe..

AnimateDiff - 쉬운 text-to-video

Text-to-video는 말 그대로 입력한 텍스트 프롬프트만 사용해 비디오를 생성하는 기법입니다. 디퓨전 기반의 text-to-video 모델은 매우 빠른 속도로 발전하고 있습니다. 이 글에서는 자신의 PC에서 직접 사용할 수 있는 text-to-video 모델 중 가장 유명한 것중 하나인 AnimateDiff를 소개(논문: AnimateDiff:Animate Your Personalized Text-to-Image Diffusion Models without Specific Tuning, Yuwei Guo 등)하고 그 작업과정을 보여드립니다. 참고: 2023년 12월, Stable Video Diffusion이 공개되었습니다. txt2vid, img2vid는 SDV를 사용하는 것이 더 빠르고 품질이 ..

Stable Diffusion 무한 줌 이미지 만들기 - ComfyUI

무한 줌 아트는 어떤 이미지가 끝없이 줌인 또는 줌아웃하는 듯한 착각을 불러 일으키는 시각 예술입니다. 아래가 그러한 예입니다. 이 글은 스테이블 디퓨전의 웹UI 중 하나인 ComfyUI를 사용해서 이러한 이미지를 생성하는 방법에 대한 글입니다. 사이 처음에는 AUTOMATIC1111 으로 무한 줌 이미지를 만드는 방법을 올리려고 했습니다. 제가 구독하고 있는 Stable Diffusion Art 사이의 글을 참고로 해서요. 간략히 정리하면, AUTOMATIC1111에서 Infinite zoom 확장을 설치한 다음, 적절한 시간마다 원하는 프롬프트를 입력하면 된다는 내용입니다. 그다지 어렵지 않을 걸로 생각했습니다. 그런데, 딱 첫번째 실험을 하려고 [Generate]버튼을 눌렀더니 에러가 발생했습니다...