스테이블 디퓨전 103

스테이블 디퓨전으로 동물 이미지를 생성하는 방법

이 글은 AUTOMATIC1111 이라는 스테이블 디퓨전 GUI를 사용하여 동물 이미지를 생성하는 방법을 다룹니다. AUTOMATIC1111 설치방법은 이 글을 읽어보시기 바랍니다. 멋진 동물 사진을 위한 프롬프트 선정 방법 좋은 이미지를 만들려면 가장 중요한 것 중 하나가 좋은 프롬프트입니다. 이미지의 종류 목표가 사실적인 사진 이미지이므로, 먼저 "photo" 키워드를 사용합니다. photo of 주제 그 다음에는 어떤 피사체를 그리고 싶은지를 선택합니다. 다음은 예시입니다. Lion (사자) Pack of wolf(늑대 무리) Red panda (레드 판다) Peacock (공작) teacup kitty(티컵 크기 고양이) 장면 장면은 배경과 주변 풍경을 제어 합니다. 프롬프트에는 연관 효과(키워드..

Stable Diffusion - 체크포인트 모델에 관한 모든 것

이 글은 스테이블 디퓨전 초보자 가이드중 마지막 글입니다. Part 1 : 생초보 가이드 Part 2 : 프롬프트 작성법 Part 3 : 인페인트 Part 4 : 모델에 관한 모든 것 스테이블 디퓨전 모델(model), 혹은 체크포인트(checkpoint) 모델은 일반적인 이미지 혹은 특정한 장르의 이미지를 생성하기 위한 목적으로 미리 학습된 스테이블 디퓨전 가중치(weight)입니다. 어떤 모델이 생성할 수 있는 이미지는 모델 학습에 사용된 이미지에 의해 결정됩니다. 고양이를 학습하지 않은 모델을 사용해서는 고양이를 생성할 수 없고, 고양이만 학습한 모델이라면 고양이 말고는 아무것도 생성하지 못합니다. 이 글에서는 모델이 무엇이고, 널리 사용되는 모델의 특성, 설치방법, 사용방법 등을 설명합니다. 설치..

Stable Diffusion으로 멋진 이미지 만들기

이 글은 제가 Stable Diffusion에 관한 글을 쓰면서, 원하는 이미지를 생성하는 방법에 관한 글을 모아둔 글입니다. 제가 Stable Diffusion에 대해 쓴 글 아래에는 모두 스테이블 디퓨전에 대해 알아두어야 할 사항들을 링크로 모아두었는데, 이미지 생성하는 방법은 아주 많고, 앞으로도 계속 늘어날 것 같아서 여기에 모아두기로 한겁니다. 계속 추가하겠습니다. Stable Diffusion으로 사실적인 인물 사진을 생성하는 방법 AI로 그린 흑인 인어 공주 사진 스테이블 디퓨전을 사용해서 비디오 만들기(Video2Video) 스테이블 디퓨전으로 QR 코드 만들기 Stable Diffusion 텍스트 효과 Stable Diffusion 조명 효과 스테이블 디퓨전 - 신비로운 테라리움과 수초어..

스테이블 디퓨전 - 신비로운 테라리움과 수초어항 생성하기

준비할 사항 Stable Diffusion AUTOMATIC1111 Web-UI를 사용합니다. 설치방법은 여기를 읽어보세요. Google Colab으로 구동할 수도 있고 Mac에도 설치할 수 있지만, 저는 윈도를 기준으로 설명합니다. 이 글에서는 Lyriel 모델을 사용합니다. Lyriel 모델은 전반적으로 어둡고 일러스트레이션 스타일의 이미지를 생성합니다. 또한 ControlNet도 사용하므로 ControlNet 설치 및 사용방법을 확인하세요. 1단계: Text-to-Image 파라미터 설정 프롬프트: spherical Terrarium, abstract dream, flower, brushes, ivy, foliage, wild, orb, fantasy, complex, gemstone, highly..

Stable Diffusion 조명 효과

조명과 관련된 키워드를 넣어주면 사진이 확 달라진다는 것은 잘 알려진 사실입니다. 이 글에서는 별도의 설명없이 그냥 여러가지 조명 관련 키워드를 넣었을 때의 효과를 보여드리겠습니다. 공통 설정사항은 아래와 같습니다. 모델 : DreamShaper v6 프롬프트: fashion photography, a woman 부정적 프롬프트: disfigured, ugly, bad, immature, cartoon, anime, 3d, painting, b&w, nsfw Width= 512, Height=768 CFG Scale: 7 Seed : 94858136 – 94858143 (시드번호에 94858136을 넣고 8장씩 돌리고 두개씩 골랐습니다.) 동일한 시드번호와 동일한 프롬프트를 사용하면 대부분 동일한 사진이..

Stable Diffusion 텍스트 효과

Stable Diffusion 을 사용해서 이미지를 생성하다보면 가끔 글씨가 포함되는 경우가 있습니다. 하지만, 대부분의 경우 무슨 내용인지 모르는 경우가 대부분이죠. 이번 글에서는 스테이블 디퓨전 ControlNet을 사용해서 텍스트를 만드는 방법을 알아보겠습니다. 방법 1 : ControlNet과 txt2img 사용 1. 아래처럼 검은 바탕에 흰색 글씨의 이미지를 만듧니다. 그림의 크기는 768x512 입니다. 2. AUTOMATIC1111 에서 txt2img 페이지를 엽니다. 3. ControlNet 부분을 펼치고 위에서 만들었던 이미지를 불러옵니다. 이 이미지는 depth map으로 사용합니다. Depth map에서 하얀색이 앞쪽을 나타내므로 글씨가 앞으로 튀어나오는 효과가 만들어집니다. 4. 콘..

스테이블 디퓨전으로 QR 코드 만들기

제가 구독하고 있는 (그리고 제일 많이 참고하는) stable-diffusion-art.com에 재미있는 글이 올라왔습니다. 스테이블 디퓨전으로 QR 코드를 제작할 수 있다는 내용입니다. 흑백에 네모네모한 QR 코드가 스테이블 디퓨전과 전혀 관계가 없을 것 같은데, 아래와 같은 걸 만든다는 겁니다. 보기에는 그냥 점들이 군데 군데 있는 것 빼고는 평범한 그림일 듯 싶고, QR 코드 냄새는 별로 안나는데도, QR코드 스캐너를 사용하면 진짜 읽히기까지 합니다!! (잘 읽히지 않으면 그림 크기를 변경하거나 카메라를 앞뒤로 움직여 보세요. 인식이 잘되는 건 아닙니다. 제 경험으로는 초점이 흐릿하게 잘 맞지 않을 때 인식이 더 잘되는 것 같더군요~ ㅎㅎ) 이 사이트의 주인장 Andrew씨도 Reddit 에 올라온..

비디오 렌더링: 제로샷 텍스트지원 Video-to-Video 변환

스테이블 디퓨전은 기본적으로 텍스트를 기반으로 이미지를 생성해주는 이미지 생성형 AI입니다. 앞서 몇번의 글에서 언급한 것처럼, 스테이블 디퓨전은 여러 이미지 간의 일관성을 유지하기 힘들었습니다. 지금까지는요. 하지만, 이제는 이미지간의 일관성을 넘어 비디오를 기반으로 새로운 비디오를 생성하는 게 가능해졌다는 내용입니다. 적용된 기술을 간단하게 말씀드리면, 기존 디퓨전 모델에 전체적인 스타일을 유지하는 제약조건, 색상을 유지하는 제약조건, 형태를 유지하는 제약조건, 텍스처를 유지하는 제약조건 등을 모두 통합해서, 비디오의 전체적인 일관성 뿐만 아니라, 국부적 시간적 일관성을 유지하는 데 성공했다는 내용입니다. 아직 소프트웨어는 공개되지 않았지만, 정식 논문 발표와 함께 공개될 예정이라고 하는데, 이 방법..

스테이블 디퓨전을 사용해서 비디오 만들기(Video2Video)

이 글은 기존에 존재하는 비디오를 사용해서, 그 자세만 복사해 새로운 비디오를 만드는 방법입니다. 스테이블 디퓨전(Stable Diffusion)은 이미지 생성형 AI 입니다. 따라서 일반적인 방법으로는 비디오를 만들기 어렵습니다. 비디오는 기본적으로 프레임으로 이루어지며, 프레임을 이미지로 보면 불가능하지는 않습니다. 그러나, 아래의 글을 읽어보시면 알겠지만, 프레임별로 동일성을 유지하기 힘들어 튀는 비디오가 만들어지기 쉽습니다. 이 글에는 아래와 같이 Video를 기반으로 새로운 비디오를 만드는 방법 5가지를 설명합니다. 그런데, 제 컴이 꼬져서 모든 걸 따라하다간 몇날 며칠이 걸릴지 몰라, 맨 처음과 맨 마지막 방법에 대해서만 직접 해보면서 설명합니다. 다른 방법은 원본 글을 읽어보세요. Contr..

인공지능 확대 도구(UpScaler) 사용법

ESRGAN과 같은 이미지 AI 확대기는 스테이블 디퓨전(Stable Diffusion)으로 생성한 이미지의 품질을 향상시키기 위해 반드시 사용해야 하는 도구입니다. 이 도구는 아주 많이 사용되기 때문에 Stable Diffusion GUI에서 기본으로 제공하는 경우가 많습니다. 이 글에서는 이미지 AI 확대기(Upscaler)가 무엇인지, 작동 원리는 어떠한지, 어떻게 사용할 수 있는지 등을 알아보겠습니다. 이 글의 목차는 아래와 같습니다. 이미지 확대 도구가 필요한 이유 전통적인 확대 도구의 단점 인공지능 확대 도구의 작동 원리 스테이블 디퓨전의 AI 확대도구 사용법 AI 확대도구 종류 새로운 Upscaler 설치방법 Upscaler2 SD Upscale 스크립트 txt2img 페이지의 Hires F..