2023/12/28 2

얼굴이 동일한 비디오를 빠르게 생성하기 - ComfyUI

이 글에서는 Video-to-video 기법, 즉 기존의 비디오를 소스로 해서 인물과 배경을 바꾼 새로운 비디오를 생성하는 기법을 설명합니다. 다만, 예전 글에서 설명한 것처럼, Video-to-video를 적용하면 화면이 번쩍거리던가 매 장면마다 사람 얼굴이 바뀌는 등의 문제가 발생하기 쉬운데, 여기서는 이런 문제를 해결한 비디오를 생성합니다. 여기서 다루는 사항은 아래와 같습니다. IP-adapter - 얼굴을 일관성있게 유지하는데 중요합니다. 다중 콘트롤넷 - 프레임간 움직임을 일정하게 유지하는데 중요합니다. AnimateDiff - 프레임간 일관성 유지에 필요합니다. 원래 짧은 비디오를 생성하는 img-to-video 모델입니다. LCM LoRA - 비디오 생성속도를 3배 이상 빠르게 합니다. D..

DALL-E 3와 Stable Diffusion XL 비교

DALL-E 3는 ChatGPT 혹은 "일상의 AI 컴패니언"을 표방하고 있는 마이크로소프트 Copilot에서 사용할 수 있습니다. 이 글에서는 DALL-E 3와 스테이블 디퓨전의 장단점을 비교해 보겠습니다. 아래는 이 글의 목차입니다. DALL-E 3란 스테이블 디퓨전이란 DALL-E 3와 Stable Diffusion XL 비교 프롬프트 이해 및 반영 텍스트 렌더링 스타일 인페인트와 아웃페인트 프롬프트 콘트롤넷 결론 DALL-E 3를 사용한 스테이블 디퓨전 개선 DALL-E 3란 DALL-E 3는 텍스트 문장을 이미지로 변환해주는 text-to-image 생성형 인공지능입니다. DALL-E 3의 학습 방법이나 모델 아키텍처는 제임스 벧커와 동료들이 저술한 "Improving Image Generati..