이미지 생성형 AI 44

HiDream 기본 워크플로(ComfyUI)

얼마전, HiDream이라는 새로운 오픈소스 이미지 생성 AI 가 등장했다는 소식을 알려드렸는데, 드디어 2025년 4월 17일 발표된 ComfyUI v0.3.29에서 HiDream을 지원하게 되었습니다. HiDream은 현재 인공지능 Text-Image Arena에서 4등을 차지하고 있는데, 오픈소스만 봤을 때는 Black Forest Labs의 Flux와 Stable Diffusion 3.5 등을 제치고 수위를 달리고 있습니다.소프트웨어따라하기HiDream 모델별 설정 소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력하며, 현재 거의 대세로 자리잡고 있는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.따라하기1 단계..

Mogao: 새로운 미스터리 AI - Seedream 3.0

갱신: Mogao는 ByteDance 의 최신 모델인 Seedream 3.0 으로 밝혀졌습니다. 현재는 이미지 아레나에서 2등으로 내려앉았네요.====이미지 생성형 인공지능 세계에 또다른 게임체인저가 등장해서 시장을 흔들고 있습니다. 그의 이름은 모가오(Mogao) 입니다. 현제 웹사이트도, 주소도 없고, 심지어는 로고도 없습니다. 그냥 며칠전에 이미지 아레나에 등장해서 2025년 4월 14일 현재 1위를 차지했습니다. GPT-4o까지 밀어내고요!4월 초부터 ArtificialAnalysis.ai의 이미지 아레나의 변화상황을 주의 깊게 살펴본 사람들은, 공식 순위에는 없지만 블라인드 테스트에서 매우 활발하게 나타난 모가오라는 모델을 주목했습니다.하지만, 그 결과는 그다지 눈에 띄지 않았습니다. 저 개인적..

수채화를 위한 AI 프롬프트

이 글에서는 인공지능으로 생성하는 수채화에 키워드가 어떠한 영향을 미치는지 알아보기 위하여, 4가지의 기본 수채화를 생성하고, 각각의 키워드를 추가하는 효과를 알아봅니다.또한 AI 모델간의 차이를 확인하기 위하여, ChatGPT에서 사용할 수 있는 GPT-4o 이미지 모델, 구글에서 개발한 Image FX 및 HiDream-l1 - Dev (일부), ReCraft(일부) 및 Flux.1 dev를 사용하여 이미지를 생성합니다.아래는 기본으로 사용하는 프롬프트입니다.A watercolor painting of a small castle on a hillA watercolor painting of a cute fox in natureA watercolor painting of a lilacA watercolo..

HiDream: 새로운 오픈소스 T2I 챔피온

HiDream.ai에서 새로운 이미지 생성형 인공지능인 HiDream-l1을 공개하였습니다. 2025년 4월 7일 월요일부터 사용가능한 이모델은 완전한 오픈소스 모델일 뿐 아니라, 매우 뛰어난 시각적 품질, 고급 자연어 이해 및 허용적인 라이선스(MIT)를 채택하고 있어 특히 눈길을 끌고 있습니다.HiDream-l1모델의 종류HiDream-l1 테스트 방법SNS 반응HiDream-l1디퓨전 트랜스포머와 함께 여러가지 전문 텍스트 인코더(T5-XXL, CLIP, LLaMA 3.1)를 결합한 하브리드 아키텍처로 설계된 HiDream-l1은 사실적인 사진, 일러스트레이션, 카툰, 디지털 아트 등과 같은 다양한 스타일의 이미지를 생성할 수 있습니다. FLUX 가 사실적인 이미지에는 뛰어나지만, 다른 스타일에는 ..

헤어 스타일을 위한 프롬프트

이 글에서는 AI가 생성하는 헤어스타일의 세계를 탐험해 보겠습니다. 모델과 사진을 변형시킬 수 있는 무한한 스타일과 색상 팔래트를 제공합니다.고전적 우아함에서 최첨단 트렌드까지, 전례 없는 정밀도와 창의성으로 자신만의 이미지를 생성하는 방법을 알아보세요.가상 초상화를 실험해보고 싶다거나, 나 자신의 새로운 스타일을 상상해보고 싶은가요? 이 프롬프트를 사용하면 헤어 아트분야의 새로운 지평을 열어줄 것입니다.프롬프트를 보완하는데 사용할 수 있는 여러가지 헤어스타일과 모델의 헤어스타일을 변경시키는데 유용한 키워드를 알아본 후, 인페인트 기법을 통해 이미 존재하는 이미지에서 헤어스타일을 변경하는 방법을 알아보겠습니다.SDXL/FLUX 헤어 디자인헤어 스타일 LoRA헤어 스타일 교체하기SDXL/FLUX와 헤어 디..

ComfyUI에서 스테이블 디퓨전 3.5 미디엄 모델 사용하기

스테이블 디퓨전 3.5 미디엄(Stable Diffusion 3.5 Medium)은 일반용 그래픽카드에서 돌릴 수 있는 AI 이미지 모델입니다. 파라미터의 수는 26개로서, 8억개인 SD 3.5 Large에 비해 적습니다.SD 3.5 미디엄은 메모리가 큰 GPU에서 이미지를 빨리 생성하고 싶은 경우, 혹은 메모리가 비교적 작은 PC에서 돌리고자 할 경우에 사용할 수 있습니다. Stablility AI에 따르면 256x256 부터 1440x1440 에 이르는 여러 해상도를 지원하는 최초의 스테이블 디퓨전 모델이라고 합니다. 소프트웨어SD 3.5 모델SD 3.5 미디엄 설치 방법SD 3.5 미디엄 모델 설정소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하는 ComfyUI를 사용합니다. ..

LoRA는 필요없다 - ComfyUI IP-Adapter

스테이블 디퓨전에서 어떤 특정한 인물의 얼굴을 넣으려면 LoRA를 학습시키거나 또는 dreambooth 를 사용해 checkpoint모델을 학습 시켜야 합니다.하지만, 새로운 모델을 학습시키는 것은 매우 시간이 걸리는 일입니다. 그런데, 이렇게 학습시킬 필요 없이 어떤 얼굴을 즉시 삽입할 수 있다면 어떨까요?이 ComfyUI 워크플로는 입력 이미지로부터 어떤 인물의 얼굴을 복사합니다. 마치 맞춤형 LoRA나 체크포인트 모델처럼 사용할 수 있지만, 학습 시킬 필요는 없는 겁니다. 심지어는 매우 빠르고 편리합니다.참고: 이 글은 IPAdapter Unified Loader FaceID 노드를 사용하도록 갱신한 워크플로입니다.소프트웨어따라하기다른 인물 사용 실험김태리조인성송혜교테스트 결과 요약소프트웨어이 글에..

Hyper-SD와 Hyper-SDXL 패스트 모델

Hyper-SD와 Hyper-SDXL은 1~8 단계만에 고품질의 이미지를 생성할 수 있다고 주장하는 농축형(distilled) 스테이블 디퓨전 모델입니다. 이글에서 다루는 내용은 다음과 같습니다.하이퍼 스테이블 디퓨전 모델의 작동원리LCM, Turbo, Lightning 등 다른 패스트 모델과의 차이AUTOMATIC1111 및 ComfyUI에서 사용하는 방법최적 이미지 설정다음은 목차입니다.소프트웨어하이퍼 스테이블 디퓨전 모델이란?ComfyUI에서 하이퍼 SDXL 사용방법하이퍼 SDXL 이미지 비교소프트웨어논문저자가 공개한  하이퍼-SD UNet과 LoRA모델을 사용하려면, ComfyUI를 사용할 필요가 있습니다. 다만, LoRA 모델은 어떠한 체크포인트 모델과도 호환됩니다.하이퍼-SD 방법론으로 학습된..

교란 어텐션 유도(Perturbed Attention Guide)

교란 어텐션 유도(Perturbed Attention Guide)은 샘플링 프로세스를 간단히 수정하여 스테이블 디퓨전 이미지를 향상시키는 것을 말합니다. 아래는 목차입니다.교란 어텐션 유도(PAG)이란?ComfyUI에서 PAG 사용법PAG 설정교란 어텐션 유도란?Perturbed Attention Guide(PAG)는 샘플링 프로세스를 변경하여 이미지 품질을 높이는 것입니다. 이 기법은 SD1.5와 SDXL 모델에 적용할 수 있습니다.좀 더 자세한 사항은 안동훈 님외의 Self-Rectifying Diffusion Sampling with Perturbed-Attention Guide를 참고하세요.U-Net에서의 어텐션(Attention)스테이블 디퓨전 SD1.5 및 SDXL 모델은 U-Net이라는 심층..

스테이블 디퓨전 샘플러: 완벽 가이드

AUTOMATIC1111과 ComfyUI에는 Euler, Heun, DDIM 등등 여러가지 샘플링 방법이 존재합니다. 이 글에서는 샘플러가 무엇인지, 작동 원리, 그리고 어떤 차이점이 있는지, 어떤 걸 사용하는 게 좋은지 등을 다룹니다.샘플링이란?샘플러(Sampler) 개요샘플러 평가이미지 수렴속도품질샘플링이란?이미지를 생성하기 위해서는 , 스테이블 디퓨전은 먼저 잠재 공간(latent space)에 완전히 무작위(random) 이미지를 생성합니다. 잡음 예측기(noise predictor)는 이미지로부터 잡음을 예측하고, 원래의 잡음 이미지에서 그 만큼의 예측된 잡음을 제거해줍니다.이 프로세스를 여러번 반복하면 최종적으로 깨끗한 이미지를 얻을 수 있습니다.이와 같은 잡음 제거(denoising) 프로세..