반응형

이미지 생성 인공지능 9

멋진 이미지를 생성하는 SDXL 프롬프트 15개

SDXL은 최신 Stable Diffusion 기술입니다. SD 1.5/2.1에 비해 생성되는 이미지의 품질이 매우 높아졌습니다. SDXL은 언어모델이 다르기 때문에 스테이블 디퓨전 v1에서 사용되는 프롬프트와는 약간 다릅니다. 이 글에서는 여러가지 스타일의 SDXL 프롬프트와, 그 결과로 생성된 이미지를 보여드립니다. 이를 기본으로 해서 여러가지 테스트를 해보시거나, 필요하신 새로운 프롬프트를 개발하실 수 있을 것입니다. 소프트웨어 설치 SDXL은 Stable Diffusion을 설치한 후 여기에 SDXL 모델을 탑재하여 사용하는 방법과, Stable Diffusion를 개발한 Stability AI에서 제공한 테스트 사이트인 Clipdrop에서 사용하는 방법이 있습니다. 물론 검색해 보시면 여기에서 ..

Stable Diffusion - 콘트롤넷 1.1 사용방법(2)

(이 글은 ControlNet 1.1의 변경 내용을 포함하여 많은 내용을 수정하여 재발행한 글입니다) ControlNet이란 인물이나 배경 등의 배치, 형상, 자세 등을 잡아내어, 이를 바탕으로 이미지를 생성해주는 Stable Diffusion 모델의 일부입니다. 이 글에서는 지난 글에 이어 ControlNet에 대한 좀더 자세한 정보를 알아보겠습니다. ControlNet 모델 요약 ControlNet 모델은 매우 다양합니다. 사실 너무 많다보니, 어떤 것이 적당한지 알기가 힘든 편입니다. 아래는 제가 나름대로 정리한 결과입니다. 대략적인 특징과 전처리기의 종류, 그리고 대표적인 전처리 결과과 적용결과를 표로 정리했습니다. 제목을 누르면 해당 글로 이동하니 참고하세요. 종류 및 특징 전처리 결과 Cann..

Stable Diffusion 2023.07.05

비디오 렌더링: 제로샷 텍스트지원 Video-to-Video 변환

스테이블 디퓨전은 기본적으로 텍스트를 기반으로 이미지를 생성해주는 이미지 생성형 AI입니다. 앞서 몇번의 글에서 언급한 것처럼, 스테이블 디퓨전은 여러 이미지 간의 일관성을 유지하기 힘들었습니다. 지금까지는요. 하지만, 이제는 이미지간의 일관성을 넘어 비디오를 기반으로 새로운 비디오를 생성하는 게 가능해졌다는 내용입니다. 적용된 기술을 간단하게 말씀드리면, 기존 디퓨전 모델에 전체적인 스타일을 유지하는 제약조건, 색상을 유지하는 제약조건, 형태를 유지하는 제약조건, 텍스처를 유지하는 제약조건 등을 모두 통합해서, 비디오의 전체적인 일관성 뿐만 아니라, 국부적 시간적 일관성을 유지하는 데 성공했다는 내용입니다. 아직 소프트웨어는 공개되지 않았지만, 정식 논문 발표와 함께 공개될 예정이라고 하는데, 이 방법..

Stable Diffusion 2023.06.16

Stable Diffusion에 대한 기본적인 이론

스테이블 디퓨전(Stable Diffusion)은 딥러닝(deep-learning) 모델중 하나입니다. 이 글에서는 스테이블 디퓨전의 작동 원리를 자세하게 알아보겠습니다. 다만, 제가 딥러닝 전문가가 아니다보니, 기술적인 내용을 생략할 수도 있고, 잘못 이해한 점도 있을 수 있다는 점을 감안해주시기 바랍니다. Stable Diffusion을 우리말로 번역하면 "안정적인 확산"입니다. 왜 이런 이름을 붙였을까요? 그냥 사용할 줄 알면 되지, 왜 작동 원리까지 알아야 할까요? 그 해답은 이렇습니다. "우리가 필요한 것은 내가 원하는 이미지를 잘 뽑아내는 것이고, 내부 작동원리를 알면 이렇게 이미지를 잘 뽑아내는 데 도움이 되기 때문"입니다. Stable Diffusion은 무엇을 하는가? 간단하게 말해서 스..

Stable Diffusion 2023.04.26

Stable Diffusion으로 사실적인 인물 사진을 생성하는 방법

스테이블 디퓨전을 활용하는 이유중 가장 중요한 것중의 하나가 사실적인 인물 사진을 생성하는 것입니다. 카메라로 직접 현장에서 찍은 것같은 진짜처럼 보이는 사진. 이 글에서는 사진 스타일의 이미지를 생성하는 원리를 알아 보겠습니다. 프롬프트, 모델, 사진확대기 등이 이 글에서 다룰 주요 내용이다. 소프트웨어 스테이블 디퓨전을 사용하는 방법은 여러가지가 있습니다. 이 글에서는 AUTOMATIC1111을 사용하는데, AUTOMATIC1111 GUI는 윈도에서도, Mac에서도, Google Colab에서도 사용할 수 있습니다. 제 컴퓨터 그래픽 카드가 오래된 것이다보니, 저는 앞으로 Google Colab 환경을 주로 사용하기로 했습니다. 프롬프트 여기에서는 사실적인 인물 사진을 생성하기 위한 고품질의 프롬프트..

Stable Diffusion 2023.04.25

OpenArt의 프롬프트 북(Prompt Book)

Stable Diffusion을 포함하여, Text2Img 방식의 그림생성 인공지능에서 가장 중요한 것중의 하나가 프롬프트(Prompt)이다. 프롬프트는 자신이 생성하고자 하는 이미지를 표현하는 단어들의 모음이다. 즉, 프롬프트를 얼마나 잘 입력하느냐가 생성된 이미지의 품질을 좌우한다. 그러나, 프롬프트 시장이 확대된다는 신문 기사에서 알 수 있는 것처럼, 좋은 프롬프트를 만드는 것은 쉬운 일이 아니다. 이 글에서는 OpenArt에 올려진 프롬프트 북(The PromptBook) 을 기준으로, 직접 테스트해보면서 필요에 따라 편집한 결과를 정리한다. 1. 서론 Tiny cute cow toy, reading a book, standing character, soft smooth lighting, soft..

Stable Diffusion 2023.04.15

Stable Diffusion 대표 UI - AUTOMATIC1111 설치방법

그림 생성형 인공지능 중 하나인 Stable Diffusion은 다양한 방법으로 사용할 수 있습니다. 오픈 소스이기 때문에 원하는 누구나 조금씩 수정하여 프로그램을 만들 수 있기 때문입니다. 며칠전 소개시켜드린 Easy Diffusion 2.5도 그중 하나입니다. 이 프로그램은 아무 사전 작업없이 그냥 파일을 다운로드 받고, 설치를 풀기만 하면 실행할 수 있어 편리합니다. 아무리 컴맹이라도 실패할 확률이 "제로"죠. 그런데 Easy Diffusion을 사용해 보니 몇가지 문제가 있었습니다. 무엇보다 최신의 기능이 지원되지 않는다는 것이었습니다. 특히 (정확히 무언지는 모르지만) LoLA를 이제 겨우 베타버전에서만 지원하기 시작했고, Inpainting에서도 생각대로 작동되지 않는 것 같았습니다. 오늘 소..

Easy Diffusion 인페인팅 사용방법

인페인팅(Inpainting)은 Stable Diffusion 모드 중 하나로서, 입력된 초기 이미지중에서 표시된 일부분만 변경하는 모드를 말한다. 그림의 배경을 바꾼다거나, 새로운 객체를 추가하고자 하는 경우 유용하다. 입력 이미지 지정 인페인팅을 사용하려면 먼저 입력용 이미지를 지정해야 한다. 입력용 이미지는 두 가지 방법으로 지정할 수 있다. 첫번째는 입력용 이미지를 직접 불러오는 것이다. 아래 그림에서 왼쪽 [Browse] 버튼을 누르고 원하는 그림을 불러오면 된다. 두번째는 Stable Diffusion 을 사용해 생성한 그림을 그대로 입력용 그림으로 지정하는 방법으로, 이미지에 마우스를 올리면 나타나는 버튼 메뉴에서 [Use as Input] 을 누르면 된다. 인페인트(InPaint) 이렇게 ..

Easy Diffusion - 가장 쉬운 Stable Diffusion 설치

그림 인공지능인 Stable Diffusion은 오픈소스이니 만큼 아주 다양한 방법으로 사용할 수 있습니다. 나무위키 사이트에 보면 Stable Diffusion web UI, Text-toArt Discord 등 여러가지 프로젝트가 있다고 하고, NovelAI와 같이 아예 Stable Diffusion 을 기반으로 만들어진 사이트들도 존재합니다. 저는 처음에 Stable Diffusion web UI를 설치하려고 했습니다. 그러다가 클라우드를 통해 스테이블 디퓨전을 사용하는 Google Colab 쪽도 기웃거렸고요. 제가 사용하는 PC가 벌써 몇년쯤 되다 보고(찾아보니 19년 9월이네요) 그다지 고사양이 아니다 보니, 아무래도 로컬로 돌리기는 힘들다 싶었기 때문입니다. 그런데 한번에 설치가 안되고, 여..

반응형