전체 글 1914

AnimateDiff를 사용한 Vid2Vid - ComfyUI

이 글에서는 AnimateDiff Prompt Travel Video-to-video, 즉, AnimateDiff 와 프롬프트를 사용해서 기준 Video를 유사한 다른 비디오를 만드는 기법을 소개시켜드립니다. 이제까지 Stable Diffusion을 사용해서 비디오를 만드는 방법은 여러번 소개시켜드렸는데(다섯가지 방법, Deforum, AnimateDiff) 여러가지 한계가 있었습니다. 이 글에서 소개시켜 드리는 방법도 완벽하다고는 할 수 없지만, 상당히 부드럽고 일관성이 있는 비디오를 생성할 수 있는 기법입니다. 이 글의 목차는 아래와 같습니다. AnimateDiff Prompt Travel의 작동 원리 소프트웨어 설정 워크플로 불러오기 사용방법 생성된 영상 품질 검사 생성 설정 변경 좋은 영상을 만들..

이미지에서 프롬프트를 알아내는 방법

멋진 AI 이미지를 발견했을 때, 무슨 프롬프트로 생성했을까 궁금할 때가 있으실 겁니다. 이럴 때 프롬프트를 알아내는 방법을 몇가지 소개시켜드립니다. 또한 이미지를 재 생성할 확률을 높일 수 있는 몇가지 기법도 소개합니다. 이 글의 목차는 다음과 같습니다.소프트웨어 설치PNG 정보에서 프롬프트 알아내기CLIP interrogator 사용하여 프롬프트 알아내기AUTOMATIC1111 기본 CLIP interrogator 사용법CLIP interrogator 확장CLIP Interrogate 사이트JoyCaption 사이트비슷한 이미지를 생성하기 위한 팁소프트웨어 설치이 블로그에서 다루는  AI 이미지 생성용 모델은 stable diffusion입니다. 하지만 이 모델은 사용하기 힘들기 때문에(python ..

ComfyUI를 위한 유용한 정보

스테이블 디퓨전으로 이미지를 생성하는 경우, 대부분 AUTOMATIC1111 웹UI를 사용합니다. 하지만, ComfyUI 는 훨씬 미세하게 조정할 수 있고, 스테이블 디퓨전의 자료처리 과정을 잘 이해할 수 있다는 점에서 나름 쓸만한 대안입니다. 게다가 사용해보면 아시겠지만, 훨씬 메모리를 덜 차지하고 속도가 빠릅니다. 저는 현재 AUTOMATIC1111을 사용하는 것이 편한 경우가 많아서 두가지 모두를 사용하고 있지만, 언젠가는 ComfyUI로 완전히 돌아서지 않을까 싶습니다. ComfyUI가 여러가지 장점이 있지만, 사용하기 쉽지 않다는 단점이 있습니다. 기능이 어딘가 숨겨져 있을텐데, 매뉴얼도 마땅치 않고... 그래서 제가 사용하면서 알게된 팁 몇가지를 공유합니다. 물론 제가 까먹지 않기 위한 목적이..

스테이블 디퓨전 QR Code 이미지 - ComfyUI

얼마 전 AUTOMATIC1111 웹UI에서 QR 코드를 만들고 로고 이미지를 넣는 방법을 소개해 드렸습니다. 간단히 요약하면 QR코드용으로 학습된 ControlNet 모델을 사용해서 QR코드 혹은 기타 이미지를 넣는 방법이었습니다. 오늘은 ComfyUI 웹 UI에서  이와 유사한 작업을 하는 방법을 소개시켜 드립니다. 이 글에서 다루는 내용은 아래와 같습니다.ComfyQR 커스톰 노드 설치QR 코드용 ControlNet 모델 설치QR 코드 ControlNet 노드 추가QR Code 확인용 노드 추가여러가지 QR Code 워크플로자세한 원리는 별로 관심이 없고 그냥 사용하고만 싶다면 맨아래에 있는 QR Code 워크플로만 따라하시면 됩니다.ComfyQR 커스톰 노드 설치ComfyUI Manager가 설치..

로고가 새겨진 이미지 만들기 - AUTOMATIC1111

먼저 아래 이미지를 보시죠. 큰 그림일 때는 잘 모르실 수도 있는데, 축소해서 보시면 잘 보이실 겁니다(Control 키를 누른 상태로 마우스 휠을 굴리면 화면을 축소/확대시킬 수 있습니다). 맞습니다. 맥도널드 로고가 새겨져 있습니다. 하나 더 보여드리겠습니다. 이 글에서는 이런 이미지를 생성할 수 있는 방법을 설명합니다. 이 글의 목차는 아래와 같습니다. 설치 QR Code 만들기 Logo가 들어간 이미지 만들기 다른 예제 설치 이 글에서 설명하는 내용을 실습해 보시려면 먼저 AUTOMATIC1111 을 설치해야 합니다. 여러가지 방법이 있지만, 윈도 환경에서 설치하는 방법은 여기를 보시면 됩니다. AUTOMATIC1111을 설치한 후에는 ControlNet 확장을 설치해야 합니다. ControlNe..

AnimateDiff - 쉬운 text-to-video

Text-to-video는 말 그대로 입력한 텍스트 프롬프트만 사용해 비디오를 생성하는 기법입니다. 디퓨전 기반의 text-to-video 모델은 매우 빠른 속도로 발전하고 있습니다. 이 글에서는 자신의 PC에서 직접 사용할 수 있는 text-to-video 모델 중 가장 유명한 것중 하나인 AnimateDiff를 소개(논문: AnimateDiff:Animate Your Personalized Text-to-Image Diffusion Models without Specific Tuning, Yuwei Guo 등)하고 그 작업과정을 보여드립니다. 참고: 2023년 12월, Stable Video Diffusion이 공개되었습니다. txt2vid, img2vid는 SDV를 사용하는 것이 더 빠르고 품질이 ..

ComfyUI에서 ControlNet 사용방법

이 글은 Stable Diffusion 용 웹UI의 일종인 ComfyUI에서 ControlNet을 사용하는 방법에 대한 글입니다. AUTOMATIC1111 에서 ControlNet을 사용하는 방법은 사용법1과 사용법2를 참고하시면 되는데, 이 글에서는 중복되는 내용은 가능한 한 다루지 않습니다. 특히, ControlNet 모델 별로 어떤 특성이 있는지에 대해서는 사용법2를 꼭 읽어보시기 바랍니다. 참고로, 이 글은 ComfyUI의 ControlNet 과 T2I-Adapter 예제 사이트 을 기본으로 하여 부족하다 싶은 것들은 다른 사이트에서 본 정보를 추가했음을 알려드립니다. 이 글에서 다루는 내용은 아래와 같습니다. Scribble ControlNet T2I-Adapter Depthmap Preproc..

SDXL - ControlNet 사용하기(AUTOMATIC1111)

SDXL은 SD1.5에 비해 훨씬 뛰어난 이미지를 생성하는 모델입니다. 많은 경우 LoRA 등을 사용하지 않고 base 모델만으로도 충분히 괜찮은 이미지를 생성해주죠. 다만, 아직도 여러가지 확장은 안정적이지 않고 아직도 지원되지 않는 것들도 많습니다. 그 중 하나가 ControlNet이었습니다. ControlNet을 사용하면 피사체의 구도, 특히 인물의 자세를 원래의 이미지와 동일하게 복사할 수 있어서 무척 유용한 확장입니다. 거의 모든 확장 중에서 거의 최고의 확장이라고 할 수 있습니다. ControlNet에 대한 좀더 자세한 사항은 이 글(1)과 이 글(2)을 읽어보시기 바랍니다. 사실 ControlNet에 관한 사항은 위의 글 두개에 모두 담았기 때문에 이 글에서는 반복할 필요가 없으니, 반복되는..

SDXL 4093가지 예술가 스타일

SDXL base 모델을 사용해서 여러 예술가들의 스타일을 테스트해보신 분이 있어 소개시켜 드립니다. 여기에 들어가보시면 직접 보실 수 있는데, 총 4387명의 스타일을 정리했다고 합니다. 아래가 대문입니다. 여기에서 예술가 이름을 입력해서 검색할 수도 있고, 아래쪽에 나열된 스타일을 클릭해서 예술가를 찾아갈 수도 있습니다. 예를 들어 "Gogh"로 검색하면 아래와 같이 고흐 스타일의 이미지를 볼 수 있습니다. 또 naturalism 을 선택하면 아래와 같이 4분의 예술가 스타일이 나열됩니다. 이처럼 미리 분류된 tag를 사용해 예술가 스타일을 찾을 수 있습니다. 아래로 내리면 아래와 같이 여러가지 여기에서 아티스트 스타일과 이름을 볼 수 있습니다. 특정한 스타일이 없을 경우, 쭉 훝어보면서 원하는 스타..

ComfyUI 초보자 가이드

제가 요즘 제일 많이 사용하는 stable diffusion용 웹 UI는 ComfyUI입니다. 처음 사용하기는 까다롭지만, 일단 원하는 대로 설정하면 사용하기가 편하기 때문입니다. 그래서 글을 몇개 쓰기는 했는데, 그다지 마음에 들지는 않았습니다. 그러던 차에 제가 구독하는 stable-diffusion-art.com에서 ComfyUI 소개글이 나와서 정리해 보기로 했습니다. (이 글도 그다지 마음에 드는 건 아니네요. ㅠㅠ) 참고로 이 글은 ComfyUI 설치방법은 다루지 않습니다. 이 글 앞부분을 보면 설치방법이 있으며, ComfyUI 사용법도 상당부분 중복되는 내용이 있으니 참고하세요. ComfyUI는 stable diffusion을 위한, 노드 기반의 GUI입니다. 이 글에서 다루는 내용은 아래와..

스테이블 디퓨전 - ComfyUI와 SDXL 사용법(5) - img2img

이 글에서는 이전 글까지 만들어온 워크플로에 img2img 기법을 적용하는 방법을 소개합니다. 이 시리즈는 아래와 같이 구성되어 있습니다. 스테이블 디퓨전 - ComfyUI 사용법(1) - 기초 - 아주 간단한 기본 SDXL 워크플로를 생성합니다. 스테이블 디퓨전 - ComfyUI 사용법(2) - 조건부여 - SDXL 에만 적용되는 조건부터를 추가하고, 조건부여 파라미터 변경에 따른 이미지 영향을 시험합니다. 스테이블 디퓨전 - ComfyUI 사용법(3) - Refiner - 완전한 SDXL 프로세스를 위해 refiner 모델을 추가합니다. 스테이블 디퓨전 - ComfyUI 사용법(4) - LoRA - 커스텀 노드를 설치하고 LoRA를 사용하는 워크플로를 생성합니다. 스테이블 디퓨전 - ComfyUI 사..

스테이블 디퓨전 - ComfyUI와 SDXL 사용법 - LoRA(4)

이 글에서는 이전 글에서 만든 워크플로에 좀 더 고급 기법을 수용할 수 있도록 수정함과 동시에 ComfyUI를 좀더 효율적으로 사용하고, 필요에 따라 워크플로를 만들 수 있는 여러가지 방법을 소개합니다. 이 글은 아래와 같이 구성되어 있습니다. 스테이블 디퓨전 - ComfyUI와 SDXL 사용법(1) - 기초 - 이 글. 아주 간단한 기본 SDXL 워크플로를 생성합니다. 스테이블 디퓨전 - ComfyUI와 SDXL 사용법(2) - 조건부여 - SDXL 에만 적용되는 조건부터를 추가하고, 조건부여 파라미터 변경에 따른 이미지 영향을 시험합니다. 스테이블 디퓨전 - ComfyUI와 SDXL 사용법(3) - Refiner - 완전한 SDXL 프로세스를 위해 refiner 모델을 추가합니다. 스테이블 디퓨전 -..

Easy Diffusion 3.0 출시

제가 제일 처음 사용하던 스테이블 디퓨전 UI인 Easy Diffusion이 3.0으로 업그레이드 되었습니다. Easy Diffusion 은 말 그대로 정말 사용하기 쉬운 장점이 있는 반면, LoRA, ControlNet 과 같은 중요한 요소들이 지원이 안되어서 아쉬웠습니다. 그런데 이번에 업그레이드 되면서 왠만한 기본 확장는 모두 지원하게 된 것 같습니다. Easy Diffusion 변경 목록에는 3.0에 다음과 같은 사항이 추가 되었다고 나옵니다. ControlNet - 일반적인 ControlNet 모델을 기본적으로 통합해서 ControlNet을 완벽하게 지원합니다. 참조용 이미지를 선택한 다음 ControlNet 필터/모델을 선택하고 실행하기만 하면 됩니다. 추가 구성이나 다운로드가 필요하지 않습니..

AUTOMATIC1111 1.6.0 자동 업그레이드

현재 제가 사용중인 AUTOMATIC1111 버전은 1.5.1 입니다. 그동안 1.5.2, 1.6.0 RC 버전이 나왔고, 오늘 1.6.0 정식버전이 나왔습니다. 저는 그동안 새 버전이 나오면 자동으로 업그레이드 되는 걸로 생각했었는데, 여러번 껏다가 켜봐도 그대로 이길래 검색해보니, 자동 업데이트가 이루어지려면 약간의 작업이 필요하더군요. 먼저 stable-diffusion-webui 의 기본 디렉토리(저는 C:\sd\stable-diffusion-webui 입니다만, 자신의 환경에 따라 달라집니다)에 들어가서 webui-user.bat 를 편집하고 아래와 같이 "git pull"을 추가해줍니다. 자동 업데이트가 싫으신 분은 이 파일을 수정하지 마시고, 필요할 때 stable-diffusion-webu..

ComfyUI용 SDXL Prompt Styler

엊그제 쓴 SDXL 모델 스타일 106가지라는 글에서는, AUTOMATIC1111 확장인 StyleSelectorSDXL 1.0을 소개했습니다. 사실상, 이 106가지 스타일이란, StyleSelectorSDXL 확장에서 제공하는 스타일을 하나씩 나열한 것에 불과했습니다. 즉, "woman" 또는 "city"와 같이 간단한 프롬프트만 입력한 상태에서 StyleSelector가 제공하는 스타일을 선택하면 다른 스타일과는 완전히 다른 새로운 이미지가 만들어졌습니다. 이 StyleSelector를 ComfyUI에서도 사용할 수 있습니다. 커스톰 노드인 SDXL Prompt Styler를 설치하면 됩니다(사실 Style Selector for SDXL 1.0 도 이 SDXL Prompt Styler를 따라한 것..