2025/02 21

AI 360 파노라마 생성하기

제가 한동안 360 파노라마 사진에 빠져 있었습니다. 360 파노라마 카테고리를 보시면 그 흔적을 보실 수 있습니다.그런데 엊그제 Reddit을 뒤적거리다가 ComfyUI용 360 파노라마 뷰어를 개발했다는 글을 보았습니다. 이 글에는 당연히 파노라마를 생성하는 도구도 포함되어 있었고요. 이 글들을 정리해서 파노라마를 생성하고 돌려볼 수 있는 워크플로를 정리했습니다. 이 워크플로를 따라하시면 아래와 같은 360 파노라마를 생성하실 수 있습니다.소프트웨어따라하기참고다른 예제개인적인 느낌소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력한 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.따라하기1 단계: 모델 다운로드체크포인트..

딮시크(DeepSeek)가 공개한 이미지 생성 모델 Janus-Pro-7B

ChatGPT를 추월하였다고 세상을 떠들썩하게 만들었던 딮시크에서 이미지 생성 모델, 더 정확히 말하자면 이미지 생성도 가능한 멀티 모달 모델 Janus Pro-7B를 오픈소스로 공개했다는 소식입니다. 이 모델은 현재 Hugging Face 플랫폼에 MIT 라이선스로 공개되어, 제한없이 상업적으로도 사용할 수 있습니다.나무위키에 따르면 Janus 자체는 10월경 Janus-1.3B (매개변수가 13억개)를 발표한 이래, 11월에 JanusFlow-1.3B를 발표한 바 있으며, 2025년 1월 27에 Janus-Pro(1B 및 7B)를 발표한 것이라고 합니다.딮시크 Janus-Pro-7B란고성능 멀디 모달 모델Janus-Pro-7B의 성능최초 사용자들의 엇갈린 반응앞으로의 가능성딮시크 Janus-Pro-7..

ComfyUI 커스톰 노드 만들기

ComfyUI를 사용하려면 커스톰 노드가 필수적입니다. 커스톰 노드(Custom Node)란 ComfyUI에서 기본으로 제공하는 노드에서는 제공하지 않는 새로운 노드를 말합니다. 대부분의 경우, 커스톰 노드를 새로 만들 필요는 거의 없습니다. 어딘가 찾아보면 누군가가 이미 해당 기능을 하는 커스톰 노드를 만들어 두었을 가능성이 높기 때문입니다. 그래도 커스톰 노드가 어떻게 만들어지는지를 알아두면 혹시 원하는 기능을 제공하는 노드가 없을 때 새로운 노드를 만들거나, 마음에 안드는 노드를 수정할 수가 있을 것입니다.다만, 여기에서 다루는 것은 매우 기초적인 내용이므로 참고만 하시기 바랍니다.SDXL_prompt_styler 커스톰 노드의 구조노드 클래스의 내용따라하기 1 - combine_text따라하기 2..

SDXL용 QR Code 이미지 생성기

예전에도 QR Code를 숨긴 이미지를 생성하는 글(A1111 용, ComfyUI 용)을 올렸습니다만, 이번엔 총정리하는 느낌으로 새로운 QR Code 이미지 생성 워크플로를 소개합니다.소프트웨어따라하기Lumina 2.0, Flux.1 Dev, SDXL 비교스타일 비교결론소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력한 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.따라하기1 단계: 모델 다운로드체크포인트 모델Juggernaut XL 모델을 다운로드 받은 후, ComfyUI\models\checkpoints 폴더에 넣어줍니다(A1111과 모델을 공유하실 경우엔 여기를 보세요). QR Monster ControlNet ..

Lumina Image 2.0 사용하기

Lumina Image 2.0은 텍스트 프롬프트로부터 이미지를 생성하는 오픈 소스 AI 모델입니다. 이 모델은 특히 예술적 스타일에 뛰어난 강점을 보이며 프롬프트를 따르는 능력이 높습니다. 소프트웨어Lumina Image 2.0이란?따라하기Lumina 2.0, Flux.1 Dev, SDXL 비교스타일 비교결론소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력한 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.Lumina Image 2.0 이란?Lumina Image 2.0은 매개변수가 26억개이며 1024x1024 해상도이 이미지를 생성할 수 있는 이미지 생성형 AI 모델입니다. 텍스트 인코더로는 Gemma-2-2B 를 활..

AI 이미지 2025.02.09

ComfyUI에서 이미지 배경 생성하기

기존의 이미지에서 배경만 새로운 인공지능 배경으로 생성할 수 있습니다. 이 워크플로는 이미지의 전경(또는 주체)는 변경하지 않고, 원 이미지의 배경과 일관성이 있는 새로운 배경을 생성합니다. 원하는 배경을 지정할 수도 있고요.아래는 원 이미지 입니다(인터넷에서 향수로 검색해서 찾은 이미지중 하나입니다).아래는 새로운 인공지능 배경으로 교체한 이미지입니다.소프트웨어워크플로 개요따라하기개인적인 느낌소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력한 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.워크플로 개요이 워크플로는 이미지 배경 삭제하기에서 사용했던 BRIA 모델을 사용해서 배경을 삭제하고 마스크를 만든 후, SDXL ..

Mochi GGUF 무비 비디오

Mochi는 짧은 비디오 움짤을 생성할 수 있는 최신의 로컬 비디오 모델입니다. 비디오를 몇개 이어서 스토리를 만들고 싶다면 어떻게 해야 할까요? Mochi 무비 비디오 워크플로를 이용하면 4개의 비디오 클립을 생성하고 이를 결합해 긴 비디오를 만들 수 있습니다. 이 무비 비디오는 ComfyUI에서 텍스트 프롬프트를 이용해 생성합니다.소프트웨어따라하기개인적인 느낌소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력한 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.따라하기1 단계: Mochi 모델 다운로드아래 사이트에서 pig-mochi...gguf 파일을 찾아 ComfyUI\models\diffusion_models 에 넣..

Mochi GGUF txt2vid (ComfyUI)

Mochi는 PC에서 돌릴 수 있는 최고의 비디오 AI 모델중 하나입니다. Mochi를 사용하면 텍스트 프롬프트를 480p 비디오로 바꿀 수 있습니다.이 글에서는 ComfyUI에서 Mochi GGUF를 설치하고 돌릴 수 있는 방법을 알려드립니다.소프트웨어Mochi AI 모델따라하기소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력한 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.Mochi AI 모델Mochi란?Mochi는 Genmo AI에서 개발한 개방형 비디오 AI 모델입니다. 아래에서 보시는 것처럼 비디오 생성 리더보드에서 2 등으로 평가받는, 매우 뛰어난 모델입니다.라이선스공개된 버전은 Mochi 1 Preview로..

TeaCache: 생성속도를 두배로

AI 이미지 생성속도를 올리고 싶으신가요? TeaCache를 사용하면 품질에는 거의 영향을 미치지 않으면서도 디퓨전 모델의 속도를 올릴 수 있습니다. 구현하기도 쉽고, 무엇보다 Flux와 Hunyuan Video와 같은 최신 이미지/비디오 생성모델에 적용할 수 있다는 장점이 있습니다.이 글에서는 TeaCache의 작동원리와 함께, Flux 및 HunyuanVideo에 적용하는 워크플로를 소개시켜드립니다.소프트웨어TeaCache 란?TeaCache의 작동 원리Flux에서 TeaCache 사용하기Hunyuan에서 TeaCache 사용하기소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력한 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기..

SVD/CogVideo/LTX/Kling/HailouAI 비교

요즘 여러가지 AI 비디오 생성 모델과 서비스가 등장하고 있습니다. 물론 가장 유명한 것은 소라(Sora)입니다. 2분가까이 되는 긴 영상을, 거의 완전한 물리적 법칙을 따르고 있는 듯한 비디오로 이름이 높습니다. 물론 유료고요. ChatGPT를 유료로 사용하면 소라도 사용할 수 있는데, 저는 아직 한번도 사용해 보지 않았습니다. 이 글에서는 제가 알고있는 몇가지 서비스에 대해 동일한 조건으로 비디오를 생성해 보고 비교해보겠습니다. 여기에서 CogVideo는 GGUF 버전이라 다른 모델/서비스보다 품질이 떨어질 수 있습니다. 또한 완벽한 비교는 아니고, 그냥 저의 느낌 정도니까 그냥 그러려니 해주시면 감사하겠습니다.Flux GUFF + SVDCogVideo GGUF Image2VideoFlux -> Kl..