티스토리

공간정보와 인터넷지도
검색하기

블로그 홈

공간정보와 인터넷지도

www.internetmap.kr/m

지금 제 관심사는 인공지능입니다. 맞습니다. 개나 소나 중 한 명입니다. 그래도 배워보겠습니다. 세상이 바뀔테니까요.

구독자
21
방명록 방문하기
공지 제 글을 퍼가지 마시고 링크를 달아주⋯ 모두보기

주요 글 목록

  • SD 3.5 - Stability AI의 깜짝쇼 2024년 10월 22일, Stability AI에서 2024년 6월 발표했던 SD 3.0에 비해 상당히 진보한 차세대 이미지 생성 모델인 Stable Diffusion 3.5(SD 3.5)를 공개했습니다(링크) 예상치 못한 복귀SD 3.5SD 3.5 사용방법결론예상치 못한 복귀 이번 Stable Diffusion 3.5는 정말 깜짝쇼에 가깝습니다. 인공지능 이미지 생성 분야에서  Stable Diffusion 3.0에 대한 실망이  커지고 Flux 가 급격한 성장을 보이는 가운데, 이런 발표를 예상했던 사람은 거의 없었습니다. 사실 2024년 6월에 발표된 버전 3.0은 커뮤니티를 전혀 설득하지 못했습니다. 이미지 품질은 열악했고 라이선스가 강화되는 바람에 많은 제작자들이 다른 솔루션으로 돌아서게 만들.. 공감수 4 댓글수 2 2025. 3. 4.
  • Stability Matrix -모든 Stable Diffusion을 한번에 현재 여러가지 이미지 생성용 AI가 공개되어 있으며, 이를 활용할 수 있는 프로그램(웹 인터페이스)도 매우 다양합니다. 저의 경우, 요즘엔 ComfyUI를 주로 사용하지만, AUTOMATIC1111, SD-Forge, Fooocus 등등 아주 많은 웹인터페이스를 사용해 왔습니다. 이렇게 여러가지를 사용하다보면, 각각 설치하고 업데이트하고... 하는 게 번거로울 뿐 아니라, 무엇보다 체크포인트 모델을 비롯하여 LoRA, ControlNet, Upscaler 등 많은 모델을 여기저기 설치하느라 관리하기가 힘들게 됩니다. 이러한 문제를 해결해줄 도구가 이 글에서 소개시켜드리는 Stability Matrix입니다.Stabiilty Matrix는 Flux 나 Stable Diffusion과 같은 이미지 생성형 A.. 공감수 0 댓글수 0 2025. 2. 19.
  • LoRA 학습용 이미지 선택 방법 LoRA를 사용하면, Flux.1 dev 모델 전체를 다시 학습시킬 필요 없이, 맞춤형 스타일을 정의할 수 있습니다. 이 기술을 사용하면 계산과 저장 측면에서 공간을 적게 차지하면서도, 특정 개념, 인물 또는 스타일에 맞춰 모델을 조정할 수 있습니다.LoRA학습 자체는 그다지 어렵지 않습니다. Flux 용 LoRA 학습 투토리얼에서 설명한 것처럼, 온라인에서도 학습시킬 수 있습니다. 그러나, 효과적인 LoRA 의 핵심은 학습 데이터세트에 달려있습니다. 즉, 학습용으로 선택한 이미지가 LoRA의 성능에 직접적으로 영향을 미치게 됩니다.이 글에서는 최적의 데이터세트를 만드는 방법을 알아보겠습니다. 이미지의 양, 이미지 다양성 및 품질의 중요성, 캡션의 생성 등과 같은 핵심적인 요소에 대해 알려드리겠습니다. .. 공감수 0 댓글수 0 2025. 2. 18.
  • Stable Diffusion 3.5 GGUF를 ComfyUI에서 사용하기 Stability Ai에서 Stable Diffusion 3.5 Large 모델과 더 빠른 Turbo 버전을 공개했습니다. Stable Diffusion Medium의 실패를 바로잡고, SD 3.5 Large는 괄목할만한 성능 향상이 이루어졌습니다. 프롬프트의 이해도가 높아졌고, 다양한 스타일의 이미지를 생성할 수 있습니다.이 글에서는 Stable Diffusion 3.5 Large 모델에 대해 알아보고, 3070에서는 메모리 부족문제로 SD 3.5 Large를 직접 돌릴 수 없기 때문에 SD 3.5 GGUF 를 이용해 ComfyUI에서 돌릴 수 있는 방법을 알아보겠습니다.소프트웨어SD 3.5 Large 모델따라하기8bit 모델 테스트워크플로 설명간편 워크플로소프트웨어이 글에서는 스테이블 디퓨전용 GUI.. 공감수 5 댓글수 2 2025. 2. 3.
  • ComfyUI에서 스테이블 디퓨전 3.5 미디엄 모델 사용하기 스테이블 디퓨전 3.5 미디엄(Stable Diffusion 3.5 Medium)은 일반용 그래픽카드에서 돌릴 수 있는 AI 이미지 모델입니다. 파라미터의 수는 26개로서, 8억개인 SD 3.5 Large에 비해 적습니다.SD 3.5 미디엄은 메모리가 큰 GPU에서 이미지를 빨리 생성하고 싶은 경우, 혹은 메모리가 비교적 작은 PC에서 돌리고자 할 경우에 사용할 수 있습니다. Stablility AI에 따르면 256x256 부터 1440x1440 에 이르는 여러 해상도를 지원하는 최초의 스테이블 디퓨전 모델이라고 합니다. 소프트웨어SD 3.5 모델SD 3.5 미디엄 설치 방법SD 3.5 미디엄 모델 설정소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하는 ComfyUI를 사용합니다. .. 공감수 2 댓글수 0 2025. 1. 14.
  • Flux 및 SD에서 프리셋 스타일 사용하기 스타일 프리셋이란 스테이블 디퓨전 혹은 Flux AI 모델에 사용할 수 있는, 널리 사용되는 스타일 모음입니다. 스타일 프리셋을 사용하면 이미지의 스타일을 빠르게 바꿀 수 있습니다.예를 들어, JuggernautXL_version6 모델을 기반으로 아래와 같은 프롬프트로 생성하는 이미지에 여러가지 스타일 프리셋을 결과입니다. 프롬프트: a man in silver suit on streetbase (프리셋 x)craft clayanime이 글에서는 SD Forge 웹UI, AUTOMATIC1111 웹UI 및 ComfyUI 웹UI에서 스타일 프리셋을 사용하는 방법을 설명합니다.스테이블 디퓨전이 처음이라면 기본적인 이론을 참고하시기 바랍니다.스타일 프리셋의 작동원리SD Forge에서 스타일 프리셋 사용방법A.. 공감수 0 댓글수 0 2024. 12. 28.
  • 스타일이 비슷한 이미지 만들기 - Style Aligned 스타일이 비슷한 이미지를 만드는 것은 로고나 서적 일러스트레이션과 같은 창조적인 작업에서 매우 유용한 기법입니다. 이 글은 스테이블 디퓨전에서 이러한 이미지를 생성하는 방법을 설명합니다.아래는 이 글에서 기술하는 기법을 사용하여 생성된 일관성있는 로고의 예입니다.또다른 예로서 아래와 같은 이미지를 생성할 수도 있습니다.이 글에서는 다음과 같은 내용을 다룹니다.Style Aligned 를 사용한 일관성있는 스타일(AUTOMATIC1111 및 ComfyUI)ControlNet Reference를 이용한 일관성있는 스타일(AUTOMATIC1111)AUTOMATIC1111과 ComfyUI의 구현상 차이점AUTOMATIC1111과 ComfyUI에서 사용하는 방법소프트웨어스타일 전송의 원리AUTOMATIC1111 .. 공감수 1 댓글수 2 2024. 12. 24.
  • SAG - 이미지 배경 살리기 SAG(Self-attention Guidance, 자기 주의 안내)는 전체적인 두고를 보존하면서 이미지의 디테일을 향상시킵니다. 따라서 이미지가 생성하는 무의미한 디테일을 수정하는데 유용합니다.아래의 예에서는 신사분이 매고 있는 보우타이를 수정하고, 배경에 있는 기타 디테일을 수정하였습니다.원 이미지SAG 적용소프트웨어SAG의 원리ComfyUI다른 예제소프트웨어이 글에서는 ComfyUI를 사용합니다. ComfyUI는 약간 복잡해 보이지만, AUTOMATIC1111보다 빠르면서도 워크플로를 마음대로 수정할 수 있어서 인기가 높아지고 있는 Web UI입니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다. SAG의 원리SAG에 대한 상세한 내용은 홍수성 님 등이 .. 공감수 0 댓글수 0 2024. 12. 23.
  • Stable Diffusion 3를 내 PC에서 돌리는 방법 얼마전, ComfyUI에서 API를 통해 SD3를 돌리는 방법을 올려드렸는데, 이 글에서는 자신의 컴퓨터에서 스테이블 디퓨전 3 미디엄(Stable Diffusion 3 medium)을 돌리는 방법에 대해 설명드립니다.소프트웨어시스템 요구사항ComfyUI에서 사용방법비교비교소프트웨어이 글에서는 ComfyUI를 사용하여 SD3 medium을 돌리는 방법을 사용합니다. ComfyUI는 매우 빠르게 사용자가 늘고 있는, 이제는 사실상 AUTOMATIC1111보다 더 많이 활용되는 것으로 예상되는 Stable Diffusion용 웹UI 입니다. ComfyUI를 설치하는 방법과 기초적인 사용법은 이 글을 읽어보시고, 좀 더 잘 활용하는 방법은 튜토리얼을 읽어보시기 바랍니다.시스템 요구사항SD3 미디엄 모델을 돌리.. 공감수 2 댓글수 4 2024. 12. 20.
  • Hyper-SD와 Hyper-SDXL 패스트 모델 Hyper-SD와 Hyper-SDXL은 1~8 단계만에 고품질의 이미지를 생성할 수 있다고 주장하는 농축형(distilled) 스테이블 디퓨전 모델입니다. 이글에서 다루는 내용은 다음과 같습니다.하이퍼 스테이블 디퓨전 모델의 작동원리LCM, Turbo, Lightning 등 다른 패스트 모델과의 차이AUTOMATIC1111 및 ComfyUI에서 사용하는 방법최적 이미지 설정다음은 목차입니다.소프트웨어하이퍼 스테이블 디퓨전 모델이란?ComfyUI에서 하이퍼 SDXL 사용방법하이퍼 SDXL 이미지 비교소프트웨어논문저자가 공개한  하이퍼-SD UNet과 LoRA모델을 사용하려면, ComfyUI를 사용할 필요가 있습니다. 다만, LoRA 모델은 어떠한 체크포인트 모델과도 호환됩니다.하이퍼-SD 방법론으로 학습된.. 공감수 2 댓글수 2 2024. 6. 21.
  • 교란 어텐션 유도(Perturbed Attention Guide) 교란 어텐션 유도(Perturbed Attention Guide)은 샘플링 프로세스를 간단히 수정하여 스테이블 디퓨전 이미지를 향상시키는 것을 말합니다. 아래는 목차입니다.교란 어텐션 유도(PAG)이란?ComfyUI에서 PAG 사용법PAG 설정교란 어텐션 유도란?Perturbed Attention Guide(PAG)는 샘플링 프로세스를 변경하여 이미지 품질을 높이는 것입니다. 이 기법은 SD1.5와 SDXL 모델에 적용할 수 있습니다.좀 더 자세한 사항은 안동훈 님외의 Self-Rectifying Diffusion Sampling with Perturbed-Attention Guide를 참고하세요.U-Net에서의 어텐션(Attention)스테이블 디퓨전 SD1.5 및 SDXL 모델은 U-Net이라는 심층.. 공감수 0 댓글수 0 2024. 6. 10.
  • 스테이블 디퓨전 샘플러: 완벽 가이드 AUTOMATIC1111과 ComfyUI에는 Euler, Heun, DDIM 등등 여러가지 샘플링 방법이 존재합니다. 이 글에서는 샘플러가 무엇인지, 작동 원리, 그리고 어떤 차이점이 있는지, 어떤 걸 사용하는 게 좋은지 등을 다룹니다.샘플링이란?샘플러(Sampler) 개요샘플러 평가이미지 수렴속도품질샘플링이란?이미지를 생성하기 위해서는 , 스테이블 디퓨전은 먼저 잠재 공간(latent space)에 완전히 무작위(random) 이미지를 생성합니다. 잡음 예측기(noise predictor)는 이미지로부터 잡음을 예측하고, 원래의 잡음 이미지에서 그 만큼의 예측된 잡음을 제거해줍니다.이 프로세스를 여러번 반복하면 최종적으로 깨끗한 이미지를 얻을 수 있습니다.이와 같은 잡음 제거(denoising) 프로세.. 공감수 11 댓글수 0 2024. 6. 7.
  • 단계 정렬(Align Your Steps) 사용방법 단계 정렬(AYS, Align Your Steps)는 Nvidia 팀에서 역 디퓨전 공식을 보다 정확하게 풀기위하여 제안한 것으로, 샘플링 프로세스를 변경한 것입니다. 논문에 따르면 AYS를 사용하면 10단계만으로도 고품질의 이미지를 생성할 수 있다고 합니다.단계 정렬이란?ComfyUI에서 단계 정렬을 사용하는 방법단계 정렬(Align Your Steps) 리뷰결론단계 정렬이란?단계정렬(Align Your Steps 는 새로운 모델이 아니라, 기존 샘플링 프로세스에 변화를 준 것입니다. 좀 더 정확하게 말씀드리자면 잡음 스케줄(noise schedule)을 변경시킨 것입니다. 따라서 단계 정렬은 어떤 모델과도 함께 사용할 수 있습니다.단계 정렬을 이해하려면 먼저 샘플링 프로세스를 이해해야 합니다. 여기에.. 공감수 1 댓글수 0 2024. 6. 7.
  • 스테이블 디퓨전 3: SDXL 및 스테이블 캐스케이드와 비교 스테이블 디퓨전 3(Stable Diffusion 3)는스테이블 디퓨전 모델 중에서 가장 최신의 가장 대형 모델입니다. Stability AI의 발표에 따르면, 자신의 기존 모델(스테이블 캐스케이드 및 SDXL)보다 텍스트 생성 능력과 프롬프트를 이해하고 따르는 능력이 훨씬 뛰어나다고 합니다.이 글에서는 Stable Diffusion 3와, 스테이블 캐스케이드, SDXL을 비교합니다. 비교할 대상은 아래와 같습니다.이 글의 목차는 아래와 같습니다.스테이블 디퓨전 3 사용방법텍스트 렌더링프롬프트 이해 및 따르기자세 제어물체의 구도손 렌더링얼굴 렌더링스타일결론스테이블 디퓨전 3 사용방법스테이블 디퓨전 3는 자신의 컴퓨터에 설치해서 사용하는 방법은 불가능하며, 개발자 API 를 통해서만 사용할 수 있습니다. .. 공감수 0 댓글수 0 2024. 6. 5.
  • ComfyUI로 스테이블 디퓨전 3 API 사용하기 Stable Diffusion 3는 Stability AI의 최신 txt2img(텍스트-이미지) 변환 모델입니다. 스테이블 캐스케이드(Stable Cascade) 및 스테이블 디퓨전 XL(SDXL)과 같은 이전 모델보다 텍스트를 생성하는 성능 및 프롬프트를 이해하고 따르는 능력이 훨씬 뛰어납니다.이 모델은 현재 많은 관심을 받고 있지만, API를 이용해서만 사용할 수 있습니다.이 글에서는 ComfyUI에서 Stable Diffusion3를 사용할 수 있는 방법을 알려드리겠습니다.따라하기1단계: ComfyUI 매니저 설치2단계: SAI API 노드 설치3단계: API 키 정의 4단계: 워크플로 불러오기샘플 이미지따라하기스테이블 디퓨전 개발사인 Stablility AI에서는 스테이블 디퓨전 3 API를 지원.. 공감수 0 댓글수 0 2024. 5. 28.
  • 투명 배경 이미지를 생성하는 방법 배경이 투명한 이미지는 디자인 작업에 유용합니다. 동일한 이미지를 여러가지 배경에 반복적으로 사용할 수 있기 때문입니다. 이 글에서는 layer Diffusion 모델을 사용하여 Stable Diffusion v1.5 및 SDXL 모델 용 투명 이미지를 생성하는 방법을 소개합니다. 소프트웨어 SD Forge로 투명 배경 이미지 제작 최신 버전 업데이트 Layer Diffusion 확장 설치 SD v1.5 투명 배경 이미지 생성 SDXL 투명 배경 이미지 생성 참고 사항 기타 스타일 ComfyUI ComfyUI로 투명 배경 이미지 제작 SD 1.5용 투명 배경 이미지 Layer Diffusion의 원리 소프트웨어 이 글에서는 SD Forge와 ComfyUI 웹 GUI를 사용합니다. SD Forge는 AUT.. 공감수 0 댓글수 4 2024. 3. 21.
  • Text-to-Image(txt2img)란? Text-to-Image(txt2img)는 인공지능 모델을 사용해서 입력된 텍스트(여러개의 단어)를 이미지로 생성해주는 것을 말합니다. txt2img AI 모델은 여러가지가 존재합니다. Text-to-image 모델의 작동 원리 Text-to-image 사용 방법 스테이블 디퓨전 txt2img 기본 설정 txt2img 모델 학습방법 Text-to-Image 모델의 종류 DALL-E Imagen 스테이블 디퓨전(Stable Diffusion) 미드저니(Midjourney) Text-to-image 모델의 작동 원리 txt2img 모델은 자연어 문장을 입력받아, 그 문장에 맞는 이미지를 생성해주는 신경망(neural network)입니다. 스테이블 디퓨전(Stable Diffusion)및 기타 인공지능 모델.. 공감수 1 댓글수 0 2024. 3. 8.
  • 스테이블 디퓨전 3 - 상세 기능 스테이블 디퓨전(Stable Diffusion) 3가 발표되고, 이 모델에 대한 상세한 내용을 담은 연구논문이 공개되었습니다. 이 모델은 아직 사용할 수 없지만, 미리 시험하기 원하신다면 대기자명단에 등록하실 수 있습니다. 스테이블 디퓨전 3 모델이란? 스테이블 디퓨전 3 모델의 장점 텍스트 생성 능력 향상 프롬프트 이해도 향상 속도와 배포 안전 스테이블 디퓨전 3의 새로운 기능 잡음 예측기 샘플링 텍스트 인코더 더 나은 캡션 스테이블 디퓨전 3 모델이란? 스테이블 디퓨전은 Stabiltity AI에서 공개한 최신의 텍스트-이미지(text-to-image) AI 모델입니다. 그런데, 기존의 v1 모델이나 SDXL 모델과는 달리, 8억개 에서 80억개의 매개변수를 가지는 여러 모델의 집합입니다. 즉, 가장.. 공감수 2 댓글수 2 2024. 3. 7.
  • ComfyUI 예제 - Stable Cascade 개요 Text-to-Image Image-to-Image Image Variations 다중 이미지 Remix Image Variations 개요 여기에 포함된 예제를 사용하기 위해서는 stable_cascade_stage_c.safetensors 및 stable_cascade_stage_b.safetensors 체크포인트 파일을 다운로드 받아, ComfyUI\models\checkpoints 폴더에 넣으셔야 합니다. 스테이블 캐스케이드는 3단계 프로세스로서, 제일 먼저 스테이지 C 모델에서 저해상도 잠상(잠재 이미지}를 생성한다. 그 다음 이 잠상을 스테이지 B 디퓨전 모델을 사용하여 확대한다. 마지막으로 이렇게 확대된 잠상이 스테이지 A로 전달되어 다시 한번 확대되고 이미지 공간으로 변환된다. 참고로.. 공감수 1 댓글수 7 2024. 2. 24.
  • Stable Diffusion 3 SDXL이 출시가 된지 이제 겨우 6개월이 된 듯하고, 1 주일 전에 Stable Cascade가 발표되었는데, 이제 스테이블 디퓨전 다음 버전이 공개되기 직전이라는 소식입니다. 이번 버전은 특히 프롬프트를 잘 이해하고, 이미지 품질이 높아지며, 아래처럼 글을 작성하는 능력이 아주 높아진다고 합니다. 또한 모델 크기가 다양하게 제공된다고 하니, 아마도 다양한 플랫폼에 적용시킬 수 있을 것으로 생각되네요. 스테이블 디퓨전의 팬으로써 또 어느 정도의 성능을 보여줄지 정말 많이 기대가 되네요. 아래는 https://stability.ai/news/stable-diffusion-3 를 그대로 번역한 내용입니다. 참고하세요~ 다중 주제 이미지 프롬프트가 가능하고, 이미지 품질, 철자 기능이 크게 향상된 Text-.. 공감수 0 댓글수 0 2024. 2. 23.
  • ComfyUI에서 스테이블 캐스케이드 사용법 스테이블 캐스케이드(Stable Cascade)가 출시된지 불과 10일정도뿐이 안되었는데, 벌써 ComfyUI에서는 정식으로 지원하기 시작했습니다. 이것만 봐도 ComfyUI가 얼마나 유연한지, 왜 요즘 사용자가 급격하게 늘고 있는지 아실 것 같습니다(AUTOMATIC1111은 언제쯤 정식으로 지원이 될까... 궁금해지네요) 참고: 이 글보다는 스테이블 캐스케이드 ComfyUI 예제 사이트 를 읽어보시길 권합니다. 이 글에 포함된 워크플로는 약간의 오류가 있고 사용하기도 조금 복잡하기 때문입니다. 아직까지 스테이블 캐스케이드를 최대한 잘 활용할 수 있는 워크플로가 모두 개발된 것은 아닙니다. ControlNet이나 LoRA도 지원된다고는 하는데 아직 제대로된 워크플로는 못찾았고요. 이 글에서는 Comfy.. 공감수 0 댓글수 0 2024. 2. 22.
  • 스테이블 캐스케이드(Stable Cascade) 10일 전쯤 스테이블 디퓨전을 개발한 Stability.ai 사가 새로운 이미지 생성 인공지능 모델인 스테이블 캐스케이드(Stable Cascade)를 공개했습니다. 불과 얼마전에 SDXL을 공개해서 1024x1024 해상도의 고품질 이미지를 생성할 수 있게되었다고 놀라워했고, 아직 완전히 정착되지도 않은 듯 싶은데 새로운 모델이 공개된 것입니다. 이번에 공개된 모델은 잠재 공간을 더욱 압축시킴으로써, 학습 및 추론 속도가 매우 빨라지면서도 생성되는 이미지의 품질은 매우 높고, 게다가 프롬프트를 이해하고 따르는 능력이 향상되었다고 합니다. 아래는 보도자료에 포함된 주요 요점이고, 목차 아래쪽은 Stability Github 페이지에 있는 내용입니다. 아주 기대되면서도 또 새로 배워야 할 것이 늘어나서 즐.. 공감수 0 댓글수 0 2024. 2. 21.
  • InstantID를 사용한 얼굴 교체 방법 얼마전에 LoRA는 필요없다 - ComfyUI IP-Adapter라는 글에서, 별도로 학습한 체크포인트나 LoRA 모델 없이 어떤 사람의 얼굴을 복제하는 방법을 알려드렸습니다. 이 글도 비슷한 내용입니다. 다만, InstantID라는 기법을 이용한 것만 다릅니다. 아래는 InstantID를 사용해 얼굴을 복제한 예입니다. 뭔가 나사가 빠진 듯 하네요. 다른 예를 봐도 아시겠지만, 이 기법은 (적어도 제가 테스트해 본 바로는) 복제한 얼굴이 닮은 정도를 비율로 따지면 10~20% 정도가 아닐까... 싶은 정도입니다. InstantID 란 InstantID 대신 사용할 수 있는 것 AUTOMATIC1111 사전 준비 콘트롤넷(ControlNet) 확장 설치 InstantID 모델 설치 AUTOMATIC111.. 공감수 1 댓글수 3 2024. 2. 19.
  • IP-Adapter: 너무 많아서 정리한다 IP-adapter(Image Prompt adapter)는 미드저니나 DallE 3와 같이, 이미지를 프롬프트로 사용할 수 있는 스테이블 디퓨전 애드온입니다. IP-adapter를 사용하면 참조 이미지로부터 스타일, 구도, 얼굴을 복사할 수 있습니다. 이 글에서는 IP-adapter의 여러가지 모델(Plus, Face ID, Face ID v2, Face ID portrait 등)과 이들 IP Adapter를 AUTOMATIC1111과 ComfyUI에서 사용하는 방법을 알아봅니다. 아래는 목차입니다.IP-adapter 모델원래의 IP-adapterIP-adapter PlusIP-adapter Plus FaceIP-adapter SDXLIP-adapter Plus SDXLIP-adapter Plus Fa.. 공감수 6 댓글수 1 2024. 2. 5.
  • Stable Diffusion 무분류기 안내(CFG) 척도란 무분류기 안내(CFG, Classifier Free Guidance) 척도(scale)은 스테이블 디퓨전 잡음 제거 샘플링 과정에서 프롬프트를 얼마나 잘 따를 것인지를 제어합니다. 이 값은 거의 모든 Stable Diffusion 기반의 인공지능 이미지 생성기에서 사용할 수 있습니다. 이제까지 제가 올린 글에는 CFG를 언급한 글이 매우 많은데, 이 글에서는 Stable Diffusion에서 CFG 척도가 무엇인지 좀 더 자세히 알아보겠습니다. CFG 척도가 하는 일 LCM과 turbo 모델의 CFG 척도 무분류기 안내란? 분류기 안내 무분류기 안내 무분류기 안내 척도 무분류기 안내의 학습 가장 좋은 CFG 척도는? CFG와 샘플링 단계의 관계 CFG를 납치하여 부정적 프롬프트 활성화 CFG 척도가 하는.. 공감수 0 댓글수 0 2024. 1. 30.
  • 잡음제거 강도(Denoising strength)란? 잡음제거 강도는 샘플링 단계에 들어가기 전, 이미지에 얼마나 많은 잡음을 추가할 것인지를 결정합니다. 특히 스테이블 디퓨전에서 image-to-image이지지 생성에서 공통적으로 사용되는 설정입니다. 잡음제거 강도는 0부터 1.0까지 설정할 수 있습니다. 0은 입력 이미지에 아무런 잡음을 추가하지 않는다는 뜻이고, 1.0은 입력된 이미지가 완전한 노이즈로 대체된다는 뜻입니다. 이러한 점에서 잡음제거 강도는 원 이미지를 보존하는 것과 완전히 새로운 이미지를 생성하는 것 사이의 균형이라고 생각하셔도 좋습니다. 결론적으로 잡음제거 강도를 높일 수록 이미지가 많이 변화하게 됩니다. AUTOMATIC1111에서 잡음제거 강도 image-to-image에서 잡음제거 강도 인페인트에서 잡음제거 강도 ComfyUI에서.. 공감수 0 댓글수 4 2024. 1. 24.
  • Stable Diffusion에서 임베딩 사용하는 방법 임베딩(embedding) 혹은 텍스트 인버전(textual inversion)은 스테이블 디퓨전에서 이미지 스타일을 제어할 수 있는 또다른 방법입니다. 이 글에서는 임베딩이 무엇인지, 어디에서 받을 수 있는지, 어떻게 사용할 수 있는지 알아보겠습니다. 임베딩이란? 임베딩을 찾을 수 있는 곳 임베딩 사용 방법 유용한 임베딩 BadDream UnrealisticDream EasyNegative 추천 임베딩 wlop_style Kuvshinov 임베딩, 드림부스, 하이퍼네트워크의 차이 임베딩이란? 임베딩은 모델을 변경시키지 않고 새로운 키워드를 정의하는 방법인 텍스트 인버전의 결과입니다. 이 기법은 3~5개의 샘플 이미지 만으로 모델에 새로운 스타일이나 새로운 객체를 삽입할 수 있어서 주목을 받았습니다. 텍.. 공감수 1 댓글수 0 2024. 1. 19.
  • Stable Diffusion - 부정적 이미지 프롬프트 스테이블 디퓨전을 비롯한 많은 AI 이미지 생성기는 이미지를 프롬프트로 사용해서 비슷한 이미지를 생성하는 기능(이미지 프롬프트(image prompt)이 존재합니다. (AUTOMATIC1111에서는 이 글을 참고하세요) 일반적으로는 텍스트 프롬프트에 이미지에 추가하고자 하는 내용을, 부정적 프롬프트에 넣고 싶지 않은 내용을 지정합니다. 그런데, 이미지 프롬프트와 마찬가지로 이미지를 사용하여 내가 표현하고 싶지 않은 것을 지정하는 "부정적 이미지 프롬프트(negative image prompt)"가 있다면 어떨까요? 이 글에서는 스테이블 디퓨전에서 부정적 이미지 프롬프트를 구현하는 방법과, 재미있는 사례 몇 가지를 소개해 드립니다. 예를 들면, 아래 그림에서는 맨 왼쪽 사진에서 가운데 있는 잔디를 빼라고 .. 공감수 0 댓글수 0 2024. 1. 19.
  • 다이내믹 프롬프트 사용법 이 글에서는 다이내믹 프롬프트를 사용하는 방법에 대해 말씀드립니다. 먼저 다이내믹 프롬프트가 무엇인지 간단하게 소개하고 AUTOMATIC1111에서 사용하는 방법, 그리고 ComfyUI에서 사용하는 방법을 설명합니다. 목차는 아래와 같습니다.Dynamic Prompt 란?AUTOMATIC1111 다이내믹 프롬프트 사용법ComfyUI 다이내믹 프롬프트 사용법다이내믹 프롬프트 문법Dynamic Prompt 란?다이내믹 프롬프트란, 프롬프트내의 일부 단어를 여러가지로 조합하여 사용할 수 있는 프롬프트를 말합니다. 예를 들어 "a {blue|yellow|red} flower" 이라는 프롬프트는 a blue flower/a yellow flower/a red flower 등 세 가지 프롬프트를 생성해 줍니다. 원.. 공감수 1 댓글수 0 2024. 1. 1.
  • SDXL 터보 - 실시간 이미지 생성 SDXL 터보 모델은 단 한번의 샘플링 단계만에 선명한 이미지를 생성하는 미세조정(fine-tuned) 모델입니다. 이 글에서 다루는 내용은 다음과 같습니다. SDXL 터보란 AUTOMATIC1111에서 SDXL 터보 사용하는 방법 ComfyUI에서 SDXL 터보 사용하는 방법 실시간 프롬프트 처리(Real-time Prompting) SDXL Turbo를 위한 최적 설정 성능 비교 SDXL Turbo와 LCM-LoRA 비교 SDXL 터보란? SDXL 터보(Turbo) 모델은 단 한번의 샘플링 단계만에 선명한 이미지를 생성하도록 미세조정(fine-tuned)한 SDXL(스테이블 디퓨전 XL) 모델입니다. 학습방법 SDXL 터보 모델의 학습 방법은 Axel Sauer 등이 저술한 논문 "적대적 확산 농축(.. 공감수 3 댓글수 0 2023. 12. 6.
    문의안내
    • 티스토리
    • 로그인
    • 고객센터

    티스토리는 카카오에서 사랑을 담아 만듭니다.

    © Kakao Corp.