반응형

전체 글 1623

AI로 그린 흑인 인어 공주 사진

디즈니 영화에 나오는 공주가 실제로는 어떻게 생겼을까요? 이제 인공지능의 도움으로 실제 모습을 만나볼 수 있습니다. 이 글은 스테이블 디퓨전(Stable Diffusion)을 사용해 환상의 숲에 있는 사실적인 공주 사진을 생성하는 방법을 설명합니다. 먼저 모델이 필요합니다. 이 글에서는 henmixReal v4.0 모델을 사용합니다. henmixReal 페이지를 읽어보면, 서양인 및 동양인을 모두 잘 표현하고 특히 어두운 표정을 잘 표현한다고 합니다. 특히 이 모델을 사용할 때에는 빛 관련 프롬프트를 잘 활용하라는 이야기가 있네요.다운로드 링크는 아래와 같습니다. https://civitai.com/api/download/models/70458?type=Model&format=SafeTensor&size..

AI/Stable Diffusion 2023.05.31

인공지능 확대 도구(UpScaler) 사용법

ESRGAN과 같은 이미지 AI 확대기는 스테이블 디퓨전(Stable Diffusion)으로 생성한 이미지의 품질을 향상시키기 위해 반드시 사용해야 하는 도구입니다. 이 도구는 아주 많이 사용되기 때문에 Stable Diffusion GUI에서 기본으로 제공하는 경우가 많습니다. 이미지 확대 도구가 필요한 이유 스테이블 디퓨전 v1의 기본 이미지 크기는 512×512픽셀입니다. 오늘날의 전반적인 상황을 생각했을 때 너무 작습니다. 예를 들어 iPhone 12의 경우, 4,032×3,024픽셀인 12MP 이미지를 생성합니다. 또한 iPhone 12의 화면은 2,532 × 1,170 픽셀까지 지원되므로, 확대기를 사용하지 않을 경우 스테이블 디퓨전으로 생성한 이미지는 화질이 떨어질 수 밖에 없습니다. 문제를..

AI/Stable Diffusion 2023.05.30

하이퍼네트워크 사용방법

스테이블 디퓨전이 어떻게 작동되는지에 대해서도 조금 알게되었고, Stable Diffusion의 대표 UI라고 할 수 있는 AUTOMATIC1111을 설치하였으며, 기본적인 사용법은 시험해 봤고, LoRA와 ControlNet도 돌려본 상태라면, 이제 Stable Diffusion을 사용해서 왠만한 정도의 사진이나 그림을 뽑아낼 수 있을 것입니다. 이 글은 이러한 기본을 뛰어 넘어 한 단계의의 기술인 하이퍼네트워크(Hypernetwork) 모델에 대한 글입니다. 이 글에서는 하이퍼네트워크가 무엇인지, 어떻게 사용하는지에 대해 설명합니다. 하이퍼네트워크란? 하이퍼네트워크는 Novel AI에서 처음 개발한, 미세 조정 기법입니다. Novel AI는 Stable Diffusion이 처음 공개된 때부터 개발에 ..

AI/Stable Diffusion 2023.05.13

Stable Diffusion - 콘트롤넷 사용방법(2)

ControlNet이란 인물이나 배경 등의 배치, 형상, 자체 등을 잡아내어, 이를 바탕으로 이미지를 생성해주는 Stable Diffusion 모델의 일부입니다. 이 글에서는 지난 글에 이어 ControlNet에 대한 좀더 자세한 정보를 알아보겠습니다. 전처리기(Preprocessor) 여기에서는 Stable Diffusion의 다양한 전처리기들을 간단한 설명과 함께 적용 예를 보여드립니다. 사례는 아래의 그림을 사용하겠습니다. 그냥 간단히 어떤 전처리기가 있나를 슬쩍 보고만 싶다면, 아래쪽에 요약 글이 있으니 참고하세요~ Canny 외곽선 추출 알고리듬 캐니는 매우 오래된 외곽선 감지기입니다. 곡선과 직선을 모두 잘 추출합니다. 하지만 노이즈에 취약할 수도 있습니다. 아래가 결과입니다. 사람은 바뀌었지..

AI/Stable Diffusion 2023.05.02

Stable Diffusion - 콘트롤넷 사용방법(1)

콘트롤넷(ControlNet)은 구도와 피사체의 자세를 복제할 수 있는 스테이블 디퓨전 모델입니다. 스테이블 디퓨전을 조금이라도 써보신 분은 아시겠지만, 생성되는 이미지가 원하는 자세를 갖도록 하는 것은 거의 불가능합니다. 자세 뿐만 아니라 배경이나 인물까지도 모두 무작위로 생성되기 때문입니다. ControlNet을 사용하면 이런 문제를 해결할 수 있습니다. ControlNet은 강력하고, 다재다능하며 어떠한 Stable Diffusion 모델과도 함께 사용할 수 있습니다. 이 글에서는 콘트롤넷(ControlNet)이 무엇인지 알아보고, 설치방법, AUTOMATIC1111에서의 사용법, 설정 방법 등에 대해 알아보겠습니다. 콘트롤넷이란? 콘트롤넷은 수정된 스테이블 디퓨전 모델입니다. 스테이블 디퓨전에서 ..

AI/Stable Diffusion 2023.04.30

Stable Diffusion - LoRA 모델 사용법

그림 생성형 인공지능인 Stable Diffusion을 사용해서 이미지를 생성하다보면 LoRA라는 단어를 자주 만날 수 있습니다. 이 글은 LoRA 모델이 무엇인지, 일반적인 checkpoint 모델과는 무엇이 다른지, 그리고 어떻게 사용해야 하는지 등에 대해 간단히 정리합니다. 로라 모델은 일반적인 checkpoint 모델에서 작은 변화만 일으키는, 크기가 작은 Stable Diffusion 모델입니다. 일반적으로 체크포인트 모델보다 1/10 ~ 1/100 정도 크기뿐이 안되어서 여러가지 모델을 수집하는 사람들에게 매우 인기가 높습니다. 이 글은 이제까지 LoRA를 사용해 보지 않은 초보자를 위한 튜토리얼입니다. LoRA가 무엇인지, 어디에 있는지, AUTOMATIC1111에서 어떻게 사용하는지 등을 ..

AI/Stable Diffusion 2023.04.27

Stable Diffusion에 대한 기본적인 이론

스테이블 디퓨전(Stable Diffusion)은 딥러닝(deep-learning) 모델중 하나입니다. 이 글에서는 스테이블 디퓨전의 작동 원리를 자세하게 알아보겠습니다. 다만, 제가 딥러닝 전문가가 아니다보니, 기술적인 내용을 생략할 수도 있고, 잘못 이해한 점도 있을 수 있다는 점을 감안해주시기 바랍니다. 스테이블 디퓨전, 우리말로 번역하면 "안정적인 확산"입니다. 왜 이런 이름을 붙였을까요? 그냥 사용할 줄 알면 되지, 왜 작동 원리까지 알아야 할까요? 그 해답은 이렇습니다. "우리가 필요한 것은 내가 원하는 이미지를 잘 뽑아내는 것이고, 내부 작동원리를 알면 이렇게 이미지를 잘 뽑아내는 데 도움이 되기 때문"입니다. Stable Diffusion은 무엇을 하는가? 간단하게 말해서 스테이블 디퓨전은..

AI/Stable Diffusion 2023.04.26

Stable Diffusion으로 사실적인 인물 사진을 생성하는 방법

스테이블 디퓨전을 활용하는 이유중 가장 중요한 것중의 하나가 사실적인 인물 사진을 생성하는 것입니다. 카메라로 직접 현장에서 찍은 것같은 진짜처럼 보이는 사진. 이 글에서는 사진 스타일의 이미지를 생성하는 원리를 알아 보겠습니다. 프롬프트, 모델, 사진확대기 등이 이 글에서 다룰 주요 내용이다. 소프트웨어 스테이블 디퓨전을 사용하는 방법은 여러가지가 있습니다. 이 글에서는 AUTOMATIC1111을 사용하는데, AUTOMATIC1111 GUI는 윈도에서도, Mac에서도, Google Colab에서도 사용할 수 있습니다. 제 컴퓨터 그래픽 카드가 오래된 것이다보니, 저는 앞으로 Google Colab 환경을 주로 사용하기로 했습니다. 프롬프트 여기에서는 사실적인 인물 사진을 생성하기 위한 고품질의 프롬프트..

AI/Stable Diffusion 2023.04.25

Stable Diffusion 인공지능 이미지 생초보 가이드

이 글은 Stable Diffusion 또는 다른 AI 이미지 생성기에 대해 거의 아무것도 알지 못하는 초보자를 위한 안내서입니다. 스테이블 디퓨전(Stable Diffusion) 이란? 스테이블 디퓨전은 일반 문자로부터 이미지를 생성하는 AI 모델입니다. 예를 들어, 생강 과자집(gingerbread hous) 사진이 필요하다고 해보죠. 이때 프롬프트(Prompt)를 다음과 같이 입력하면 gingerbread hous, diorama, in focus, white background, toast, cruch cereal 스테이블 디퓨전은 다음과 같은 이미지를 생성해 줍니다. 아주 간단합니다!. 그리고 상당히 쓸만합니다! DALL-E 혹은 미드저니(MidJourney)와 같이 텍스트에서 이미지를 생성하는..

AI/Stable Diffusion 2023.04.21

Automatic1111 GUI: 초보자 가이드(메뉴 해설)

Atutomatic1111 Stable Diffusion webUI는 사실상의 표준 GUI입니다. 새로운 기능이 나오면 여기에 가장 먼저 등장합니다. 그런데 쉬운 소프트웨어는 아닙니다. 문서도 별로 없구요. 메뉴를 들여다보면, 특히 설정(Settings)의 경우 너무 복잡해서 숨이 넘어갈 정도입니다. 이글은 AUTOMATIC1111 GUI를 사용하는 방법에 대한 가이드입니다. 투토리얼로 생각해도 무방합니다. 여러가지 예제가 많이 들어있으니 직접 실습해보시면 좋습니다. AUTOMATIC1111이 뭘 할 수 있는지가 궁금하다면 먼저 대충 어떤 기능이 있는지만 알아보고, 나중에 확인해 보는 것도 좋습니다. txt2img 탭 GUI를 시작하면 제일 먼저 보이는 것이 text2img (Text to Image)탭..

AI/Stable Diffusion 2023.04.17 (1)
반응형