전체 글 1738

소프트 인페인트

소프트 인페인트(Soft inpainting)를 사용하면 원래의 이미지에 인페인트되는 내용을 이음매 없이 연결해 줍니다. 즉, 잡음 제거 강도(denoising strength)를 높게 유지하면서도 복잡한 장면에서 경계가 뚜렷하게 나타나는 현상을 막을 수 있습니다. 아래는 소프트 인페인트의 예입니다. 배경 일반 인페인트 소프트 인페인 소프트웨어 간단한 예제 일반 인페인트 소프트 인페인트 소프트 인페인트의 작동원리 소프트 인페인트 설정 소프트웨어 이 글에서는 스테이블 디퓨전 모델의 웹 GUI 중에서 가장 대중적이고 널리 사용되고 있는 AUTOMATIC1111을 사용합니다. 설치 방법은 이 글은 보시고, 메뉴를 비롯한 기초적인 내용은 AUTOMATIC1111 가이드를 읽어보세요. 간단한 예제 배경 생성 먼저..

스테이블 디퓨전에서 손가락 수정하기

스테이블 디퓨전에서 이미지를 생성하면 손 형태가 잘못되거나 손가락이 4개 혹은 6개 등 이상해 지는 경우가 적지 않게 발생합니다. 이 글에서는 이러한 결함이 발생한 손 이미지를 수정하는 방법을 다룹니다. 소프트웨어 간단한 인페인트 업스케일(Upscaling) SDXL 모델의 경우 Hand Refiner 소프트웨어 이 글에서는 스테이블 디퓨전용 웹 GUI 중에서 가장 널리 사용되고 있는 AUTOMATIC1111을 사용합니다. AUTOMATIC1111은 Mac 이나 Google Colab에서도 사용할 수 있지만, 제 블로그에서는 윈도11에서 사용하는 방법만 다루고 있습니다. 스테이블 디퓨전에 대해 좀 더 알고 싶으시면 기본적인 이론이나 초보자 가이드를 참고하세요. 간단한 인페인트 생성한 이미지중 일부가 잘못..

Text-to-Image(txt2img)란?

Text-to-Image(txt2img)는 인공지능 모델을 사용해서 입력된 텍스트(여러개의 단어)를 이미지로 생성해주는 것을 말합니다. txt2img AI 모델은 여러가지가 존재합니다. Text-to-image 모델의 작동 원리 Text-to-image 사용 방법 스테이블 디퓨전 txt2img 기본 설정 txt2img 모델 학습방법 Text-to-Image 모델의 종류 DALL-E Imagen 스테이블 디퓨전(Stable Diffusion) 미드저니(Midjourney) Text-to-image 모델의 작동 원리 txt2img 모델은 자연어 문장을 입력받아, 그 문장에 맞는 이미지를 생성해주는 신경망(neural network)입니다. 스테이블 디퓨전(Stable Diffusion)및 기타 인공지능 모델..

스테이블 디퓨전 3 - 상세 기능

스테이블 디퓨전(Stable Diffusion) 3가 발표되고, 이 모델에 대한 상세한 내용을 담은 연구논문이 공개되었습니다. 이 모델은 아직 사용할 수 없지만, 미리 시험하기 원하신다면 대기자명단에 등록하실 수 있습니다. 스테이블 디퓨전 3 모델이란? 스테이블 디퓨전 3 모델의 장점 텍스트 생성 능력 향상 프롬프트 이해도 향상 속도와 배포 안전 스테이블 디퓨전 3의 새로운 기능 잡음 예측기 샘플링 텍스트 인코더 더 나은 캡션 스테이블 디퓨전 3 모델이란? 스테이블 디퓨전은 Stabiltity AI에서 공개한 최신의 텍스트-이미지(text-to-image) AI 모델입니다. 그런데, 기존의 v1 모델이나 SDXL 모델과는 달리, 8억개 에서 80억개의 매개변수를 가지는 여러 모델의 집합입니다. 즉, 가장..

3D 카툰 캐릭터

이 글에 있는 워크플로를 사용하면 아래와 같은 3D 카툰 캐릭터를 생성할 수 있습니다. 소프트웨어 따라하기 소프트웨어 AUTOMATIC1111 이 글에 있는 워크플로는 가장 널리 사용되고 있는 스테이블 디퓨전용 웹 GUI인 AUTOMATIC1111을 사용합니다. AUTOMATIC1111의 설치 방법은 이 글을 보시고, 초보자 가이드도 참고하세요. 체크포인트 모델 이 글에서는 SDXL 의 미세조정 모델중 하나인 Samaritan 3D character 모델을 사용합니다. 모델을 다운로드 받은 후, stable-diffusion-webui\models\Stable-Diffusion 폴더에 넣어줍니다. 참고로 이 폴더 속에 하위 폴더를 설치해서 넣어도 됩니다. 저의 경우에는 SDXL 용 모델은 별도로 XL 이..

아날로그 카메라 사진 생성하기 - ComfyUI

AI 이미지는 어딘가 인위적인 느낌이 많이들고, 사실적인 느낌이 떨어지기 마련입니다. 이 글에서는 이미지에 입자(grain) 효과와 비네팅(vignett) 효과를 추가하여 사실적인 이미지를 만드는 워크플로를 소개합니다. 소프트웨어 따라하기 변형 방법 간략한 워크플로 설명 소프트웨어 ComfyUI 이 글에서는 노드 기반의 스테이블 디퓨전용 GUI인 ComfyUI를 사용합니다. ComfyUI는 AUTOMATIC1111보다 속도가 빠르고 유연하기 때문에 요즘 사용자가 급증하는 추세입니다. ComfyUI의 설치방법 및 기본적인 사용방법은 이 글을, 투토리얼은 이 글을 읽어보시기 바랍니다. 따라하기 1 단계 : ComfyUI 워크플로 불러오기 아래 그림이나 json 파일을 다운로드 받은 후, ComfyUI 화면에..

단어에 텍스트 효과 추가하기 - ComfyUI

꽤 오래전에, 위 그림과 같이 텍스트 효과를 입히는 방법에 대한 글을 썼습니다. AUTOMATIC1111 에서 콘트롤넷을 사용해 구현했는데, 꽤 괜찮은 결과물이 나왔었죠. 하지만, 이제 스테이블 디퓨전이 진화한 스테이블 캐스케이드(Stable Cascade)를 사용해서, 콘트롤넷을 사용하지 않고도 txt-to-image에서 텍스트효과를 추가할 수 있게 되었습니다. 아래는 몇가지 예입니다. 소프트웨어 따라하기 다른 이미지 생성 소프트웨어 이 글은 Stable Diffusion용 웹UI중 하나인 ComfyUI를 사용합니다. AUTOMATIC1111보다 복잡하지만, 속도가 빠르는 등 여러가지 장점이 있어서, 사용자가 급격히 늘고 있는 웹UI입니다. 설치하는 방법과 기본 사용 방법은 이 글을 보시고, 투토리얼을..

SD Forge로 SVD 비디오 생성방법

SD Forge는 AUTOMATIC1111의 변형 버전으로, 매우 실행속도가 빠르는 등 여러가지 장점이 있는 스테이블 디퓨전용 웹 UI입니다. 특히 ControlNet, SDV 등 몇가지 확장이 미리 통합되어 있어 따로 설치할 필요가 없어 편리합니다. 이 글에서는 SD Forge를 사용하여 SVD 비디오를 생성하는 방법을 알아보겠습니다. 스테이블 비디오 디퓨전(SVD)이란 txt2img 로 이미지 생성 SVD 비디오 생성 GIF 변환 스테이블 비디오 디퓨전(SVD)이란 스테이블 비디오 디퓨전(Stable Video Diffusion)은 2023년 11월 1일 Stability.ai에서 발표한, 이미지를 사용하여 짧은 비디오(움짤)을 생성하는 img2vid 생성 모델입니다. 이 글을 읽어보시면 ComfyU..

SD Forge 설치방법

Stabel Forge WebUI Forge(SD Forge)는 스테이블 디퓨전용 웹 UI 중 하나로서, VRAM이 적은 GPU에서도 빠르게 이미지가 생성되는 등 여러가지 장점이 있습니다. 이 글은 Stable Diffusion용 고급 GUI인 SD Forge를 설치하는 방법을 설명합니다. SD Forge란? SD Forge의 장점 SD Forge 설치방법(Windows) AUTOMATIC1111 과 모델 공유 SD Forge란? SD Forge는 AUTOMATIC1111의 변형 버전입니다. SD Forge는 이미지 생성이 빠르며, 일부 확장이 미리 설치되어 있고, 특정 기능이 가능하도록 일부 백엔드를 수정하였다는 것이 특징입니다. SD Forge의 장점 빠른 이미지 생성 개발팀에 따르면, SD Forg..

ComfyUI 예제 - Stable Cascade

개요 Text-to-Image Image-to-Image Image Variations 다중 이미지 Remix Image Variations 개요 여기에 포함된 예제를 사용하기 위해서는 stable_cascade_stage_c.safetensors 및 stable_cascade_stage_b.safetensors 체크포인트 파일을 다운로드 받아, ComfyUI\models\checkpoints 폴더에 넣으셔야 합니다. 스테이블 캐스케이드는 3단계 프로세스로서, 제일 먼저 스테이지 C 모델에서 저해상도 잠상(잠재 이미지}를 생성한다. 그 다음 이 잠상을 스테이지 B 디퓨전 모델을 사용하여 확대한다. 마지막으로 이렇게 확대된 잠상이 스테이지 A로 전달되어 다시 한번 확대되고 이미지 공간으로 변환된다. 참고로..

Stable Diffusion 3

SDXL이 출시가 된지 이제 겨우 6개월이 된 듯하고, 1 주일 전에 Stable Cascade가 발표되었는데, 이제 스테이블 디퓨전 다음 버전이 공개되기 직전이라는 소식입니다. 이번 버전은 특히 프롬프트를 잘 이해하고, 이미지 품질이 높아지며, 아래처럼 글을 작성하는 능력이 아주 높아진다고 합니다. 또한 모델 크기가 다양하게 제공된다고 하니, 아마도 다양한 플랫폼에 적용시킬 수 있을 것으로 생각되네요. 스테이블 디퓨전의 팬으로써 또 어느 정도의 성능을 보여줄지 정말 많이 기대가 되네요. 아래는 https://stability.ai/news/stable-diffusion-3 를 그대로 번역한 내용입니다. 참고하세요~ 다중 주제 이미지 프롬프트가 가능하고, 이미지 품질, 철자 기능이 크게 향상된 Text-..

ComfyUI에서 스테이블 캐스케이드 사용법

스테이블 캐스케이드(Stable Cascade)가 출시된지 불과 10일정도뿐이 안되었는데, 벌써 ComfyUI에서는 정식으로 지원하기 시작했습니다. 이것만 봐도 ComfyUI가 얼마나 유연한지, 왜 요즘 사용자가 급격하게 늘고 있는지 아실 것 같습니다(AUTOMATIC1111은 언제쯤 정식으로 지원이 될까... 궁금해지네요) 참고: 이 글보다는 스테이블 캐스케이드 ComfyUI 예제 사이트 를 읽어보시길 권합니다. 이 글에 포함된 워크플로는 약간의 오류가 있고 사용하기도 조금 복잡하기 때문입니다. 아직까지 스테이블 캐스케이드를 최대한 잘 활용할 수 있는 워크플로가 모두 개발된 것은 아닙니다. ControlNet이나 LoRA도 지원된다고는 하는데 아직 제대로된 워크플로는 못찾았고요. 이 글에서는 Comfy..

스테이블 캐스케이드(Stable Cascade)

10일 전쯤 스테이블 디퓨전을 개발한 Stability.ai 사가 새로운 이미지 생성 인공지능 모델인 스테이블 캐스케이드(Stable Cascade)를 공개했습니다. 불과 얼마전에 SDXL을 공개해서 1024x1024 해상도의 고품질 이미지를 생성할 수 있게되었다고 놀라워했고, 아직 완전히 정착되지도 않은 듯 싶은데 새로운 모델이 공개된 것입니다. 이번에 공개된 모델은 잠재 공간을 더욱 압축시킴으로써, 학습 및 추론 속도가 매우 빨라지면서도 생성되는 이미지의 품질은 매우 높고, 게다가 프롬프트를 이해하고 따르는 능력이 향상되었다고 합니다. 아래는 보도자료에 포함된 주요 요점이고, 목차 아래쪽은 Stability Github 페이지에 있는 내용입니다. 아주 기대되면서도 또 새로 배워야 할 것이 늘어나서 즐..

가림천 뒤의 여인

이 글은 아래와 같은 이미지를 생성하는 방법을 다룹니다. 소프트웨어 따라하기 이미지 템플릿 참고사항 소프트웨어 AUTOMATIC1111 이 글에서는 스테이블 디퓨전용 대표적인 웹 UI인 AUTOMATIC1111을 사용합니다. 설치하는 방법은 이 글을 참고하세요. AUTOMATIC1111을 잘 모르신다면 초보자 가이드를 읽어보시기 바랍니다. 체크포인트 모델 이 글에서는 SD 1.5 의 미세조정 모델중 하나인 Realistic Vision v5.1 모델을 사용합니다. 다운로드 받으신 후, stable-diffusion-webui\models\Stable-Diffusion 폴더에 넣으세요. 콘트롤넷(ControlNet) AUTOMATIC1111에서 가장 중요한 확장중 하나인 ControlNet을 설치해야 합니..

InstantID를 사용한 얼굴 교체 방법

얼마전에 LoRA는 필요없다 - ComfyUI IP-Adapter라는 글에서, 별도로 학습한 체크포인트나 LoRA 모델 없이 어떤 사람의 얼굴을 복제하는 방법을 알려드렸습니다. 이 글도 비슷한 내용입니다. 다만, InstantID라는 기법을 이용한 것만 다릅니다. 아래는 InstantID를 사용해 얼굴을 복제한 예입니다. 뭔가 나사가 빠진 듯 하네요. 다른 예를 봐도 아시겠지만, 이 기법은 (적어도 제가 테스트해 본 바로는) 복제한 얼굴이 닮은 정도를 비율로 따지면 10~20% 정도가 아닐까... 싶은 정도입니다. InstantID 란 InstantID 대신 사용할 수 있는 것 AUTOMATIC1111 사전 준비 콘트롤넷(ControlNet) 확장 설치 InstantID 모델 설치 AUTOMATIC111..