이미지 생성형 인공지능 10

Text-to-Image(txt2img)란?

Text-to-Image(txt2img)는 인공지능 모델을 사용해서 입력된 텍스트(여러개의 단어)를 이미지로 생성해주는 것을 말합니다. txt2img AI 모델은 여러가지가 존재합니다. Text-to-image 모델의 작동 원리 Text-to-image 사용 방법 스테이블 디퓨전 txt2img 기본 설정 txt2img 모델 학습방법 Text-to-Image 모델의 종류 DALL-E Imagen 스테이블 디퓨전(Stable Diffusion) 미드저니(Midjourney) Text-to-image 모델의 작동 원리 txt2img 모델은 자연어 문장을 입력받아, 그 문장에 맞는 이미지를 생성해주는 신경망(neural network)입니다. 스테이블 디퓨전(Stable Diffusion)및 기타 인공지능 모델..

3D 카툰 캐릭터

이 글에 있는 워크플로를 사용하면 아래와 같은 3D 카툰 캐릭터를 생성할 수 있습니다. 소프트웨어 따라하기 소프트웨어 AUTOMATIC1111 이 글에 있는 워크플로는 가장 널리 사용되고 있는 스테이블 디퓨전용 웹 GUI인 AUTOMATIC1111을 사용합니다. AUTOMATIC1111의 설치 방법은 이 글을 보시고, 초보자 가이드도 참고하세요. 체크포인트 모델 이 글에서는 SDXL 의 미세조정 모델중 하나인 Samaritan 3D character 모델을 사용합니다. 모델을 다운로드 받은 후, stable-diffusion-webui\models\Stable-Diffusion 폴더에 넣어줍니다. 참고로 이 폴더 속에 하위 폴더를 설치해서 넣어도 됩니다. 저의 경우에는 SDXL 용 모델은 별도로 XL 이..

단어에 텍스트 효과 추가하기 - ComfyUI

꽤 오래전에, 위 그림과 같이 텍스트 효과를 입히는 방법에 대한 글을 썼습니다. AUTOMATIC1111 에서 콘트롤넷을 사용해 구현했는데, 꽤 괜찮은 결과물이 나왔었죠. 하지만, 이제 스테이블 디퓨전이 진화한 스테이블 캐스케이드(Stable Cascade)를 사용해서, 콘트롤넷을 사용하지 않고도 txt-to-image에서 텍스트효과를 추가할 수 있게 되었습니다. 아래는 몇가지 예입니다. 소프트웨어 따라하기 다른 이미지 생성 소프트웨어 이 글은 Stable Diffusion용 웹UI중 하나인 ComfyUI를 사용합니다. AUTOMATIC1111보다 복잡하지만, 속도가 빠르는 등 여러가지 장점이 있어서, 사용자가 급격히 늘고 있는 웹UI입니다. 설치하는 방법과 기본 사용 방법은 이 글을 보시고, 투토리얼을..

Stable Diffusion - 프롬프트에 관한 모든 것

좋은 프롬프트를 만드는 과정은 모든 스테이블 디퓨전 사용자가 마주치는 첫번째 단계입니다. 이 글에서는 여러가지 실험과 사용자 들의 반응을 종합한 프롬프트 제작 절차 및 기법을 요약한 글입니다. 참고: 이 글을 읽고 실제 프롬프트를 작성할 때에는 chatGPT로 프롬프트를 만드는 방법도 추천드립니다. 아래는 이 글의 목차입니다. 좋은 프롬프트의 구성 피사체(Subject, 주제) 이미지 종류(Media) 스타일(Style) 예술 작품 공유 웹사이트(Art-sharing website) 해상도(Resolution) 추가 세부사항(Additional detail) 색(Color) 조명(Lighting) 부정적 프롬프트 키워드 목록 좋은 프롬프트를 만드는 절차 프롬프트 관련 기술적 사항 비슷한 얼굴 생성 방법 ..

스테이블 디퓨전 - ComfyUI와 SDXL 사용법(5) - img2img

이 글에서는 이전 글까지 만들어온 워크플로에 img2img 기법을 적용하는 방법을 소개합니다. 이 시리즈는 아래와 같이 구성되어 있습니다. 스테이블 디퓨전 - ComfyUI 사용법(1) - 기초 - 아주 간단한 기본 SDXL 워크플로를 생성합니다. 스테이블 디퓨전 - ComfyUI 사용법(2) - 조건부여 - SDXL 에만 적용되는 조건부터를 추가하고, 조건부여 파라미터 변경에 따른 이미지 영향을 시험합니다. 스테이블 디퓨전 - ComfyUI 사용법(3) - Refiner - 완전한 SDXL 프로세스를 위해 refiner 모델을 추가합니다. 스테이블 디퓨전 - ComfyUI 사용법(4) - LoRA - 커스텀 노드를 설치하고 LoRA를 사용하는 워크플로를 생성합니다. 스테이블 디퓨전 - ComfyUI 사..

ComfyUI용 SDXL Prompt Styler

엊그제 쓴 SDXL 모델 스타일 106가지라는 글에서는, AUTOMATIC1111 확장인 StyleSelectorSDXL 1.0을 소개했습니다. 사실상, 이 106가지 스타일이란, StyleSelectorSDXL 확장에서 제공하는 스타일을 하나씩 나열한 것에 불과했습니다. 즉, "woman" 또는 "city"와 같이 간단한 프롬프트만 입력한 상태에서 StyleSelector가 제공하는 스타일을 선택하면 다른 스타일과는 완전히 다른 새로운 이미지가 만들어졌습니다. 이 StyleSelector를 ComfyUI에서도 사용할 수 있습니다. 커스톰 노드인 SDXL Prompt Styler를 설치하면 됩니다(사실 Style Selector for SDXL 1.0 도 이 SDXL Prompt Styler를 따라한 것..

스테이블 디퓨전: 애니 모델 및 프롬프트

스테이블 디퓨전에서 자유롭게 사용할 수 있는 다양한 애니 모델을 사용하면, 멋진 애니 이미지를 생성할 수 있습니다. 이 글에 포함된 내용은 아래와 같습니다. 소프트웨어 설정 애니 체크포인트 모델 애니용 임베딩(Embeddings) 애니용 로라(LoRA) 애니용 VAE Hires. Fix를 사용하여 색상을 향상시키는 방법 애니용 프롬프트 프롬프트 예제 소프트웨어 설정 이 글에서는 윈도11용 AUTOMATIC1111 스테이블 디퓨전 UI를 사용합니다. AUTOMATIC1111 설치방법은 이 글을 읽어보시기 바랍니다. 참고로 현재 SDXL 1.0이 공개되었으나, 이를 기반으로 한 미세조정(Fine-tuned) 모델이나 LoRA 등은 나오지 않은 상태입니다. 따라서 AUTOMATIC1111 버전은 1.5.1이지..

After Detailer(adetailer): 얼굴 자동 수정

After Detailer(adetailer)는 인페인트를 자동화시켜주는 스테이블 디퓨전 AUTOMATIC1111 확장입니다. 이 확장을 사용하면 얼굴이 일그러지는 것 같은 일반적인 문제를 빠르게 수정할 수 있습니다. After Detailer 확장 설치 After Detailer 확장을 설치하는 방법은 아래와 같습니다. 1. Extension 페이지로 들어가서 "Install from URL" 탭으로 들어간 뒤, 아래의 내용을 [URL]에 입력합니다. https://github.com/Bing-su/adetailer 2. Install 버튼을 누르고 잠시 기다립니다. 설치가 완료되면 아래와 같이 Installed 탭으로 들어가 adetailer가 추가되었는지 확인하고 [Apply and restart ..

Stable Diffusion 인공지능 이미지 생초보 가이드

이 글은 Stable Diffusion 또는 다른 이미지 생성형 AI에 대해 거의 아무것도 알지 못하는 초보자를 위한 안내서입니다. (예전에 써둔 글을 새로운 내용을 추가하고 일부 수정하였습니다) 저도 그림은 하나도 그릴 줄 모르지만, 위와 같은 그림도 쉽게 생성할 수 있습니다(이 그림은 DALL-E 3에서 생성하고 스테이블 디퓨전으로 아웃페인트한 결과입니다). 이 글은 스테이블 디퓨전 초보자 가이드 중 첫번째 글입니다. Part 1 : 생초보 가이드 Part 2 : 프롬프트 작성법 Part 3 : 인페인트 Part 4 : 모델에 관한 모든 것 아래는 이 글에 포함된 내용입니다. 이미지 생성형 인공지능의 종류 스테이블 디퓨전(Stable Diffusion) 이란? Stable Diffusion 사용방법은..

AI 이미지 2023.06.26

Stable Diffusion 조명 효과

조명과 관련된 키워드를 넣어주면 사진이 확 달라진다는 것은 잘 알려진 사실입니다. 이 글에서는 별도의 설명없이 그냥 여러가지 조명 관련 키워드를 넣었을 때의 효과를 보여드리겠습니다. 공통 설정사항은 아래와 같습니다. 모델 : DreamShaper v6 프롬프트: fashion photography, a woman 부정적 프롬프트: disfigured, ugly, bad, immature, cartoon, anime, 3d, painting, b&w, nsfw Width= 512, Height=768 CFG Scale: 7 Seed : 94858136 – 94858143 (시드번호에 94858136을 넣고 8장씩 돌리고 두개씩 골랐습니다.) 동일한 시드번호와 동일한 프롬프트를 사용하면 대부분 동일한 사진이..