인공지능 이미지 94

스테이블 디퓨전 3 - 상세 기능

스테이블 디퓨전(Stable Diffusion) 3가 발표되고, 이 모델에 대한 상세한 내용을 담은 연구논문이 공개되었습니다. 이 모델은 아직 사용할 수 없지만, 미리 시험하기 원하신다면 대기자명단에 등록하실 수 있습니다. 스테이블 디퓨전 3 모델이란? 스테이블 디퓨전 3 모델의 장점 텍스트 생성 능력 향상 프롬프트 이해도 향상 속도와 배포 안전 스테이블 디퓨전 3의 새로운 기능 잡음 예측기 샘플링 텍스트 인코더 더 나은 캡션 스테이블 디퓨전 3 모델이란? 스테이블 디퓨전은 Stabiltity AI에서 공개한 최신의 텍스트-이미지(text-to-image) AI 모델입니다. 그런데, 기존의 v1 모델이나 SDXL 모델과는 달리, 8억개 에서 80억개의 매개변수를 가지는 여러 모델의 집합입니다. 즉, 가장..

아날로그 카메라 사진 생성하기 - ComfyUI

AI 이미지는 어딘가 인위적인 느낌이 많이들고, 사실적인 느낌이 떨어지기 마련입니다. 이 글에서는 이미지에 입자(grain) 효과와 비네팅(vignett) 효과를 추가하여 사실적인 이미지를 만드는 워크플로를 소개합니다. 소프트웨어 따라하기 변형 방법 간략한 워크플로 설명 소프트웨어 ComfyUI 이 글에서는 노드 기반의 스테이블 디퓨전용 GUI인 ComfyUI를 사용합니다. ComfyUI는 AUTOMATIC1111보다 속도가 빠르고 유연하기 때문에 요즘 사용자가 급증하는 추세입니다. ComfyUI의 설치방법 및 기본적인 사용방법은 이 글을, 투토리얼은 이 글을 읽어보시기 바랍니다. 따라하기 1 단계 : ComfyUI 워크플로 불러오기 아래 그림이나 json 파일을 다운로드 받은 후, ComfyUI 화면에..

SD Forge 설치방법

Stable Diffusion Forge WebUI (SD Forge)는 스테이블 디퓨전용 웹 UI 중 하나로서, VRAM이 적은 GPU에서도 빠르게 이미지가 생성되는 등 여러가지 장점이 있습니다.이 글은 Stable Diffusion용 고급 GUI인 SD Forge를 설치하는 방법을 설명합니다. SD Forge란?SD Forge의 장점SD Forge 설치방법(Windows)AUTOMATIC1111 과 모델 공유SD Forge란?SD Forge는 AUTOMATIC1111으로부터 파생된 웹 UI로 사용법은 비슷하지만, 콘트롤넷 등의 필수 확장을 내장하였고, 속도가 빠른 것이 특징입니다. 사용법은 AUTOMATIC1111 사용법 과 거의 비슷하니 참고하세요.SD Forge의 장점빠른 이미지 생성개발팀에 따르..

Stable Diffusion 3

SDXL이 출시가 된지 이제 겨우 6개월이 된 듯하고, 1 주일 전에 Stable Cascade가 발표되었는데, 이제 스테이블 디퓨전 다음 버전이 공개되기 직전이라는 소식입니다. 이번 버전은 특히 프롬프트를 잘 이해하고, 이미지 품질이 높아지며, 아래처럼 글을 작성하는 능력이 아주 높아진다고 합니다. 또한 모델 크기가 다양하게 제공된다고 하니, 아마도 다양한 플랫폼에 적용시킬 수 있을 것으로 생각되네요. 스테이블 디퓨전의 팬으로써 또 어느 정도의 성능을 보여줄지 정말 많이 기대가 되네요. 아래는 https://stability.ai/news/stable-diffusion-3 를 그대로 번역한 내용입니다. 참고하세요~ 다중 주제 이미지 프롬프트가 가능하고, 이미지 품질, 철자 기능이 크게 향상된 Text-..

ComfyUI에서 스테이블 캐스케이드 사용법

스테이블 캐스케이드(Stable Cascade)가 출시된지 불과 10일정도뿐이 안되었는데, 벌써 ComfyUI에서는 정식으로 지원하기 시작했습니다. 이것만 봐도 ComfyUI가 얼마나 유연한지, 왜 요즘 사용자가 급격하게 늘고 있는지 아실 것 같습니다(AUTOMATIC1111은 언제쯤 정식으로 지원이 될까... 궁금해지네요) 참고: 이 글보다는 스테이블 캐스케이드 ComfyUI 예제 사이트 를 읽어보시길 권합니다. 이 글에 포함된 워크플로는 약간의 오류가 있고 사용하기도 조금 복잡하기 때문입니다. 아직까지 스테이블 캐스케이드를 최대한 잘 활용할 수 있는 워크플로가 모두 개발된 것은 아닙니다. ControlNet이나 LoRA도 지원된다고는 하는데 아직 제대로된 워크플로는 못찾았고요. 이 글에서는 Comfy..

스테이블 캐스케이드(Stable Cascade)

10일 전쯤 스테이블 디퓨전을 개발한 Stability.ai 사가 새로운 이미지 생성 인공지능 모델인 스테이블 캐스케이드(Stable Cascade)를 공개했습니다. 불과 얼마전에 SDXL을 공개해서 1024x1024 해상도의 고품질 이미지를 생성할 수 있게되었다고 놀라워했고, 아직 완전히 정착되지도 않은 듯 싶은데 새로운 모델이 공개된 것입니다. 이번에 공개된 모델은 잠재 공간을 더욱 압축시킴으로써, 학습 및 추론 속도가 매우 빨라지면서도 생성되는 이미지의 품질은 매우 높고, 게다가 프롬프트를 이해하고 따르는 능력이 향상되었다고 합니다. 아래는 보도자료에 포함된 주요 요점이고, 목차 아래쪽은 Stability Github 페이지에 있는 내용입니다. 아주 기대되면서도 또 새로 배워야 할 것이 늘어나서 즐..

IP-Adapter: 너무 많아서 정리한다

IP-adapter(Image Prompt adapter)는 미드저니나 DallE 3와 같이, 이미지를 프롬프트로 사용할 수 있는 스테이블 디퓨전 애드온입니다. IP-adapter를 사용하면 참조 이미지로부터 스타일, 구도, 얼굴을 복사할 수 있습니다. 이 글에서는 IP-adapter의 여러가지 모델(Plus, Face ID, Face ID v2, Face ID portrait 등)과 이들 IP Adapter를 AUTOMATIC1111과 ComfyUI에서 사용하는 방법을 알아봅니다. 아래는 목차입니다.IP-adapter 모델원래의 IP-adapterIP-adapter PlusIP-adapter Plus FaceIP-adapter SDXLIP-adapter Plus SDXLIP-adapter Plus Fa..

ChatGPT4에서 DALL-E 3 사용해 보기

얼마전에 마이크로소프트 CoPilot에서 DALL-E 3 를 사용해본 글을 올렸습니다. DALL-E 3 는 특히 프롬프트를 이해하고 따르는 능력이 매우 좋다는 장점이 있고, 이미지를 수정하는 기능이 없고 크기를 변경할 수 없다는 점이 단점이 있다고 말씀드렸습니다. 하지만 Copilot에서는 무료로 사용할 수 있는 장점이 있죠. 이번에는 유료(한달에 20달러)인 ChatGPT 4에서 DALL-E 3를 테스트해보겠습니다. 제가 하는 일 때문에 한달간 유료 결재를 했거든요. 사실 ChatGPT 4를 계속 사용한다면야 한달 20달러가 그다지 비싸다고는 생각하지 않습니다. 하지만 개인적으로 사용하는 입장에서는 그냥 아깝죠. 테스트 방법은 예전 글에서 사용한 프롬프트를 재활용해서 비교하는 방식입니다. 그런데 제목 ..

AI로 그린 판타지 바탕화면 월페이퍼 - ComfyUI

요즘은 그다지 컴퓨터 바탕 화면에 신경을 쓰지 않습니만, 한때는 고해상도 Wall paper를 구하느라 인터넷을 뒤적거렸던 기억이 나네요. 이 글에서는 여러가지 다양한 스타일의 바탕화면 이미지를 자동 생성해주는 ComfyUI 워크플로를 소개시켜 드립니다. 아래는 이 워크플로로 자동 생성한 월 페이퍼들입니다. 보시는 것처럼, 색깔/테마/계절 등이 다양하게 생성됩니다. 소프트웨어 따라하기 설정 변경 방법 Efficient 노드를 사용한 개선 버전 윈도11 바탕 화면 설정 윈도11 바탕 화면 설정 소프트웨어 이 글에서는 스테이블 디퓨전을 위한 GUI 중 하나인 ComfyUI를 사용합니다. 설치 및 기본 사용방법은 이 글을 보시면 됩니다. 조금 중복되는 부분도 있지만, 초보자 가이드도 참고하세요. 따라하기 1단..

Fooocus: 아주 간편한 Stable Diffusion

Fooocus는 스테이블 디퓨전을 기반으로 한 무료, 오픈소스 AI 이미지 생성기입니다. Fooocus는 스테이블 디퓨전과 미디저니(Midjourney)의 장점을 결합하였습니다. 즉, 오픈소스, 오프라인, 무료로 사용할 수 있으며, 사용법이 매우 간단합니다. Fooocus는 스테이블 디퓨전 파이프라인을 최적화하여 고품질의 이미지를 생성합니다. 설정을 어떻게 바꿀까 고민할 필요가 없이, 그 시간에 어떤 이미지를 생성하고 싶은지를 고민하시면 됩니다. 아래는 이 글의 목차입니다. Fooocus의 장단점 Fooocus 설치 방법 Fooocus 사용 방법 고급 설정 성능(Performance) 설정 종횡비(Aspect Ratio) 설정 스타일(Style) 설정 모델(Model) 설정 이미지 확대(Upscale) ..