AI 이미지/AI 기타 22

Recraft에서 SVG 이미지 생성하기

미드저니, DALL-E와 같은 독점적 이미지 생성사이트 혹은 Stable Diffusion, Flux 와 같은 오픈소스 이미지 생성 모델은 모두 보통의 PNG, JPG 등의 래스터(raster) 이미지를 생성합니다. 이러한 이미지를 확대해보면 하나하나의 점(픽셀)로 구성되는데, 확대/축소/변형하면 색이 뭉개지거나 픽셀이 드러나는 등 이미지 품질이 열화됩니다.반면 픽셀이 아니라, 선, 면과 같은 도형으로 구성되는 벡터(vector) 이미지의 경우에는 크기 변경에 관계없이 항상 일정한 품질을 유지하는 특성이 있죠. 그래서 사실적 사진이 아닌, 아이콘이나 로고, 일러스트 같은 경우에는 벡터 형식이 훨씬 효과적입니다. Recraft는 현재 Text2Image 생성 Leaderboard에서 1위를 차지하고 있는,..

AI SVG 이미지 생성하기

복잡한 소프트웨어로 시간을 낭비할 필요없이, 깔끔하고, 크기 조절이 가능하면서도 웹에 적합한 이미지를 만드는 방법을 고민해본적이 있으신가요? 해답은 AI와 SVG 생성기로 생성한 벡터이미지입니다. 이를 사용하면 텍스트 프롬프트를 몇초만에 고품질 벡터 이미지로 바꿀 수 있습니다.흐릿한 픽셀이나, 계단으로 나타나는 현상도 더 이상 없습니다. 오늘날 AI 도구는 벡타그래픽 생성 기술을 혁신시켜, 전문 그래픽 디자이너와 크리에이터들이 원하는 결과를 빠르고 효과적으로  생성해주는 매우 실용적인 솔루션을 제공하고 있습니다. SVG란?AI 벡터 그래픽 생성기AI SVG 생성기의 장점AI SVG 생성기 사용 예SVG란?SVG(Scalable Vector Graphics)는 품질이 조금도 손상되지 않으면서 모든 화면 크..

Recraft v3 - 디자이너를 위한 최고의 이미지 생성 AI

이미지 생성 품질 벤치마크 우승Recraft v3의 강점제어 및 디자인 기능API 지원Recraft 에서는 10월 30일, 이미지 생성 분야에서 최고의 성능을 발휘한다고 평가받는 Recraft V3를 공개하였습니다. Recraft V3는 Artificial Analysis의 Text-to-Image Leaderboard에서 모든 경쟁 모델을 제치고 1등을 차지하였습니다. 무엇보다 새로운 Recraft V3는 이미지 품질이 뛰어나고, 프롬프트를 잘 이해하고 따르며 인체를 정확하게 표현하는 등, 기존의 이미지 생성 인공지능의 기능에서 중요한 요소를 성공적으로 해결한 것으로 보입니다. 그 위에 래스터 이미지외에도 벡터 이미지를 지원하고, 텍스트 위치와 크기를 지정하거나, 브랜드 이미지를 입력받아 스타일을 지정..

이디오그램(Ideogram) 2.0 발표

이디오그램 2.0향상된 스타일 제어iOS 앱이디오그램 API이디오그램 검색Describe와 Magic Prompt를 사용한 고급 프롬프트선도적인 이미지 생성개인적인 생각이디오그램 2.0Ideogram 2.0이 이제 ideogram.ai 와 새로운 iOS 앱을 통해 무료로 제공됩니다. 프리미엄 기능은 구독을 통해서 사용가능합니다. 또한 개발자들은 새로운 베타 Ideogram API를 사용하여 Idogram 2.0을 통합할 수 있습니다.우리는 사실적 이미지, 그래픽 디자인, 타이포그래피 등을 생성하는 새로운 텍스트-이미지 모델인 Ideogram 2.0을 출시하게 되었습니다. 다름 모든 이디오그램 모델과 마찬가지로, 이디오그램 2.0도 맨 처음부터 새롭게 학습을 하였으며, 이미지-텍스트 정렬, 전반적인 주관적..

FLUX GGUF 포맷이란?

GGUF 포맷이란?GGUF 포맷을 사용하는 이유FLUX + GGUF = 🚀GGUF FLUX 사용방법기타 GGUF 포맷의 사용기타 GGUF 포맷의 사용GGUF 포맷이란?GGUF 포맷은 인공지능 모델을 위한 새로운 바이너리 포맷으로서, 특히 로딩 속도가 높고, 유연성이 뛰어나며, 모델의 모든 정보를 하나의 파일로 통합하도록 설계된 포맷입니다. 이 포맷은 2023년 8월에 도입되었으며, GGML 및 GGJT 포맷의 발전된 형태입니다. 이 포맷은 FLUX 이미지 생성 모델을 포함하여, llama.cpp를 사용하는 모델에 특히 적합합니다.GGUF 포맷을 사용하는 이유GGUF 포맷은 AI 모델을 보다 간단하면서도 효율적으로 사용하기 위한 목적으로 만들어졌습니다. 즉, 모델을 불러오는 속도를 빠르게 하고, 다양한 ..

딮시크(DeepSeek)가 공개한 이미지 생성 모델 Janus-Pro-7B

ChatGPT를 추월하였다고 세상을 떠들썩하게 만들었던 딮시크에서 이미지 생성 모델, 더 정확히 말하자면 이미지 생성도 가능한 멀티 모달 모델 Janus Pro-7B를 오픈소스로 공개했다는 소식입니다. 이 모델은 현재 Hugging Face 플랫폼에 MIT 라이선스로 공개되어, 제한없이 상업적으로도 사용할 수 있습니다.나무위키에 따르면 Janus 자체는 10월경 Janus-1.3B (매개변수가 13억개)를 발표한 이래, 11월에 JanusFlow-1.3B를 발표한 바 있으며, 2025년 1월 27에 Janus-Pro(1B 및 7B)를 발표한 것이라고 합니다.딮시크 Janus-Pro-7B란고성능 멀디 모달 모델Janus-Pro-7B의 성능최초 사용자들의 엇갈린 반응앞으로의 가능성딮시크 Janus-Pro-7..

ChatGPT4에서 DALL-E 3 사용해 보기

얼마전에 마이크로소프트 CoPilot에서 DALL-E 3 를 사용해본 글을 올렸습니다. DALL-E 3 는 특히 프롬프트를 이해하고 따르는 능력이 매우 좋다는 장점이 있고, 이미지를 수정하는 기능이 없고 크기를 변경할 수 없다는 점이 단점이 있다고 말씀드렸습니다. 하지만 Copilot에서는 무료로 사용할 수 있는 장점이 있죠. 이번에는 유료(한달에 20달러)인 ChatGPT 4에서 DALL-E 3를 테스트해보겠습니다. 제가 하는 일 때문에 한달간 유료 결재를 했거든요. 사실 ChatGPT 4를 계속 사용한다면야 한달 20달러가 그다지 비싸다고는 생각하지 않습니다. 하지만 개인적으로 사용하는 입장에서는 그냥 아깝죠. 테스트 방법은 예전 글에서 사용한 프롬프트를 재활용해서 비교하는 방식입니다. 그런데 제목 ..

Fooocus: 아주 간편한 Stable Diffusion

Fooocus는 스테이블 디퓨전을 기반으로 한 무료, 오픈소스 AI 이미지 생성기입니다. Fooocus는 스테이블 디퓨전과 미디저니(Midjourney)의 장점을 결합하였습니다. 즉, 오픈소스, 오프라인, 무료로 사용할 수 있으며, 사용법이 매우 간단합니다. Fooocus는 스테이블 디퓨전 파이프라인을 최적화하여 고품질의 이미지를 생성합니다. 설정을 어떻게 바꿀까 고민할 필요가 없이, 그 시간에 어떤 이미지를 생성하고 싶은지를 고민하시면 됩니다. 아래는 이 글의 목차입니다. Fooocus의 장단점 Fooocus 설치 방법 Fooocus 사용 방법 고급 설정 성능(Performance) 설정 종횡비(Aspect Ratio) 설정 스타일(Style) 설정 모델(Model) 설정 이미지 확대(Upscale) ..

DALL-E 3와 Stable Diffusion XL 비교

DALL-E 3는 ChatGPT 혹은 "일상의 AI 컴패니언"을 표방하고 있는 마이크로소프트 Copilot에서 사용할 수 있습니다. 이 글에서는 DALL-E 3와 스테이블 디퓨전의 장단점을 비교해 보겠습니다. 아래는 이 글의 목차입니다. DALL-E 3란 스테이블 디퓨전이란 DALL-E 3와 Stable Diffusion XL 비교 프롬프트 이해 및 반영 텍스트 렌더링 스타일 인페인트와 아웃페인트 프롬프트 콘트롤넷 결론 DALL-E 3를 사용한 스테이블 디퓨전 개선 DALL-E 3란 DALL-E 3는 텍스트 문장을 이미지로 변환해주는 text-to-image 생성형 인공지능입니다. DALL-E 3의 학습 방법이나 모델 아키텍처는 제임스 벧커와 동료들이 저술한 "Improving Image Generati..

DALL-E 3 사용법 및 평가(Copilot)

저는 거의 스테이블 디퓨전을 사용해서 인공지능 이미지를 생성하지만, 이 글에서는 이미지 생성형 인공지능의 하나인 DALL-E 3 에 대해 알아보겠습니다. 이 글의 내용은 아래와 같습니다. DALL-E 3 개요 DALL-E 3 사용법 다른 예제 아이디어 탐구용 그림 생성 DALL-E 3 평가 DALL-E 3 개요 DALL-E 는 ChatGPT를 개발한 것으로 유명한 OpenAI에서 개발한 이미지 생성형 인공지능입니다. DALL-E 3는 2023년 9월 공개되었으며, 이전 모델에 비해, 그리고 경쟁 이미지 생성형 인공지능에 비해 프롬프트(문장 입력)를 훨씬 잘 반영하는 것으로 유명합니다. DALL-E 3 는 유료인 ChatGPT Plus에서 사용할 수 있으며, 마이크로소프트에서 "일상의 AI 컴패니언"이라고..