이미지 생성 AI 8

스테이블 디퓨전에서 손가락 수정하기

스테이블 디퓨전에서 이미지를 생성하면 손 형태가 잘못되거나 손가락이 4개 혹은 6개 등 이상해 지는 경우가 적지 않게 발생합니다. 이 글에서는 이러한 결함이 발생한 손 이미지를 수정하는 방법을 다룹니다. 소프트웨어 간단한 인페인트 업스케일(Upscaling) SDXL 모델의 경우 Hand Refiner 소프트웨어 이 글에서는 스테이블 디퓨전용 웹 GUI 중에서 가장 널리 사용되고 있는 AUTOMATIC1111을 사용합니다. AUTOMATIC1111은 Mac 이나 Google Colab에서도 사용할 수 있지만, 제 블로그에서는 윈도11에서 사용하는 방법만 다루고 있습니다. 스테이블 디퓨전에 대해 좀 더 알고 싶으시면 기본적인 이론이나 초보자 가이드를 참고하세요. 간단한 인페인트 생성한 이미지중 일부가 잘못..

ChatGPT4에서 DALL-E 3 사용해 보기

얼마전에 마이크로소프트 CoPilot에서 DALL-E 3 를 사용해본 글을 올렸습니다. DALL-E 3 는 특히 프롬프트를 이해하고 따르는 능력이 매우 좋다는 장점이 있고, 이미지를 수정하는 기능이 없고 크기를 변경할 수 없다는 점이 단점이 있다고 말씀드렸습니다. 하지만 Copilot에서는 무료로 사용할 수 있는 장점이 있죠. 이번에는 유료(한달에 20달러)인 ChatGPT 4에서 DALL-E 3를 테스트해보겠습니다. 제가 하는 일 때문에 한달간 유료 결재를 했거든요. 사실 ChatGPT 4를 계속 사용한다면야 한달 20달러가 그다지 비싸다고는 생각하지 않습니다. 하지만 개인적으로 사용하는 입장에서는 그냥 아깝죠. 테스트 방법은 예전 글에서 사용한 프롬프트를 재활용해서 비교하는 방식입니다. 그런데 제목 ..

ComfyUI 인페인트 기법

ComfyUI로 인페인트를 적용하는 것은 AUTOMATIC1111을 사용할 때만큼 쉽지 않습니다. ComfyUI 예제 사이트에 올라온 워크플로를 포함해서 실제로 적용해보면 에러가 발생하는 경우가 많습니다. 이 글에서는 좀 더 괜찮은 인페인트 워크플로를 몇개 올립니다. 사실 저는 여기에 있는 워크플로보다, 엊그제 올린 자동 인페인트/아웃페인트 - ComfyUI 워크플로가 제일 마음에 듭니다만, 이 글도 참고하시길. 소프트웨어 워크플로 활용방법 일반 모델을 사용한 인페인트 인페인트 모델을 사용한 인페인트 콘트롤넷 인페인트 FaceDetailer 자동 얼굴 수정 기존 사진의 얼굴 수정 소프트웨어 이 글에서는 오픈소스 이미지 생성 AI 인 스테이블 디퓨전(Stable Diffusion)의 대표적인 GUI 중 하..

스테이블 디퓨전 - ComfyUI와 SDXL 사용법(3) - Refiner

이 글은 주로 ComfyUI 에서 SDXL refiner 모델을 사용하는 방법을 다룹니다. 이 시리즈는 아래와 같이 구성되어 있습니다. 스테이블 디퓨전 - ComfyUI와 SDXL 사용법(1) - 기초 - 이 글. 아주 간단한 기본 SDXL 워크플로를 생성합니다. 스테이블 디퓨전 - ComfyUI와 SDXL 사용법(2) - 조건부여 - SDXL 에만 적용되는 조건부터를 추가하고, 조건부여 파라미터 변경에 따른 이미지 영향을 시험합니다. 스테이블 디퓨전 - ComfyUI와 SDXL 사용법(3) - Refiner - 완전한 SDXL 프로세스를 위해 refiner 모델을 추가합니다. 스테이블 디퓨전 - ComfyUI와 SDXL 사용법(4) - LoRA - 커스텀 노드를 설치하고 LoRA를 사용하는 워크플로를 ..

SDXL 0.9로 AI 이미지 생성 - Clipdrop

한달전, 스테이블 디퓨전을 개발해서 오픈 소스로 공개한 stability.ai에서 그 후속 모델인 SDXL 을 공개했습니다. 현재 사용가능한 버전은 0.9이며, 7월 중순에 1.0을 공개할 예정이라고 합니다(오늘 18일이니 약속시간이 좀 지난듯) 자세한 내용은 보도자료 글을 읽어보시면 됩니다. 스테이블 디퓨전 UNET의 매개변수는 8억 6천만개 정도인데, SDXL 0.9는 매개변수가 100억개 정도로 늘어나서 더 세밀하고 구도가 뛰어난 이미지를 생성할 수 있다고 합니다. 기본 생성 이미지의 해상도도 1024x1024로 커졌고요. 그래서... 이걸 사용해보고 싶기는 하지만, 현재는 AUTOMATIC1111에서 기본으로 지원하지 않고 확장으로 겨우겨우 시험해 볼 수 있는 상태에서 테스트가 만만하지는 않습니다..

Stable Diffusion으로 멋진 이미지 만들기

이 글은 제가 Stable Diffusion에 관한 글을 쓰면서, 원하는 이미지를 생성하는 방법에 관한 글을 모아둔 글입니다. 제가 Stable Diffusion에 대해 쓴 글 아래에는 모두 스테이블 디퓨전에 대해 알아두어야 할 사항들을 링크로 모아두었는데, 이미지 생성하는 방법은 아주 많고, 앞으로도 계속 늘어날 것 같아서 여기에 모아두기로 한겁니다. 계속 추가하겠습니다. Stable Diffusion으로 사실적인 인물 사진을 생성하는 방법 AI로 그린 흑인 인어 공주 사진 스테이블 디퓨전을 사용해서 비디오 만들기(Video2Video) 스테이블 디퓨전으로 QR 코드 만들기 Stable Diffusion 텍스트 효과 Stable Diffusion 조명 효과 스테이블 디퓨전 - 신비로운 테라리움과 수초어..

Stable Diffusion 텍스트 효과

Stable Diffusion 을 사용해서 이미지를 생성하다보면 가끔 글씨가 포함되는 경우가 있습니다. 하지만, 대부분의 경우 무슨 내용인지 모르는 경우가 대부분이죠. 이번 글에서는 스테이블 디퓨전 ControlNet을 사용해서 텍스트를 만드는 방법을 알아보겠습니다. 방법 1 : ControlNet과 txt2img 사용 1. 아래처럼 검은 바탕에 흰색 글씨의 이미지를 만듧니다. 그림의 크기는 768x512 입니다. 2. AUTOMATIC1111 에서 txt2img 페이지를 엽니다. 3. ControlNet 부분을 펼치고 위에서 만들었던 이미지를 불러옵니다. 이 이미지는 depth map으로 사용합니다. Depth map에서 하얀색이 앞쪽을 나타내므로 글씨가 앞으로 튀어나오는 효과가 만들어집니다. 4. 콘..

Stable Diffusion - LoRA 모델 사용법

그림 생성형 인공지능인 Stable Diffusion을 사용해서 이미지를 생성하다보면 LoRA라는 단어를 자주 만날 수 있습니다. 이 글은 LoRA 모델이 무엇인지, 일반적인 checkpoint 모델과는 무엇이 다른지, 그리고 어떻게 사용해야 하는지 등에 대해 간단히 정리합니다. 로라 모델은 일반적인 checkpoint 모델에서 작은 변화만 일으키는, 크기가 작은 Stable Diffusion 모델입니다. 일반적으로 체크포인트 모델보다 1/10 ~ 1/100 정도 크기뿐이 안되어서 여러가지 모델을 수집하는 사람들에게 매우 인기가 높습니다. 이 글은 이제까지 LoRA를 사용해 보지 않은 초보자를 위한 튜토리얼입니다. LoRA가 무엇인지, 어디에 있는지, AUTOMATIC1111에서 어떻게 사용하는지 등을 ..