구글이 Google I/O 2025에서 최신 버전의 이미지 생성모델 Imagen 4를 발표했습니다. 한층 더 디테일이 살아있는 이미지를 생성할 수 있으며, 특히 프롬프트 이해도가 훨씬 높아졌고 이미지에 텍스트를 렌더링하는 능력도 올라갔습니다. 구글은 Gemini 2.5 Flash 등 일련의 인공지능 제품/서비스에서 ChatGPT 등에서 빼앗겼던 주도권을 되찾는 중으로, Imagen 4도 미드저니나 Flux, GPT-Image와 같은 경쟁자를 바짝 추격하거나 앞서기 시작하고 있습니다.
아래는 2025년 6월 18일 현재 Text-to-Image 서비스에 대한 Leaderboard입니다. 역시 아직도 GPT-4o가 1등을 차지하고 있고, Seedream 3.0/Recraft v3까지는 변함이 없으나, 그 아래에서는 구글과 Black Forest Labs가 치열한 각축전을 벌이고 있음을 알 수 있습니다.
새로운 생성 모델
가장 눈에 띄게 발전된 것은 이미지 내에 텍스트를 생성하는 능력입니다. 구글에서는 가독성, 스펠링, 문자열 배치 등에서 상당히 향상되어서, 프리젠테이션이나 포스터, 디자인, 완전한 가상의 장면까지, 전문적인 용도로 활용될 수 있는 길을 열었다고 주장하고 있습니다.
![]() |
![]() |
다만 아래의 이미지에서 볼 수 있는 것처럼 아직 한글은 지원하지 못하고 있습니다. 아래쪽에 있는 작은 글씨 주소는 아주 잘 나왔는데 한글은 모두 이해 불가능이네요.
아래는 이 이미지의 프롬프트입니다. 느끼시겠지만, 위쪽에 있는 계란 박스 이미지를 JoyCaption에서 텍스트로 해석한 후, 한글이 들어가도록 약간 수정한 내용입니다.
A high-resolution photograph featuring a carton of Golden Yolk eggs placed on a rustic wooden table. The carton, predominantly white with a glossy finish, is prominently displayed. It has a colorful, cartoon-style label on the front. The label depicts a pastoral scene with a red barn in the background, surrounded by lush green fields and a blue sky with a yellow sun. Four white chickens are illustrated on the right side of the label, with one standing in front of the barn.
Above the chickens, the text reads "공간정보와 인터넷지도" in bold, black letters. Below the chickens, the text states "http://www.internetmap.kr" in small black font.
The carton is placed on a yellow and white checkered cloth, which adds a warm, homely touch to the scene. The wooden table has a weathered, natural finish, suggesting a farmhouse or rural setting.
The lighting is natural, casting soft shadows that enhance the texture of the wooden table and the carton. The overall aesthetic is cozy and inviting, evoking a sense of rural charm and farm-fresh quality.
이러한 내용의 이미지를 종횡비 16:9로 생성해줘.
놀라운 시각적 효과
구글 I/O에서 최초로 시연한 바에 따르면 Imagen 4는 시각적으로 매우 풍부한 렌더링을 보여주었습니다. 초현실적인 사진이나, 추상적 이미지, 벡터 일러스트레이션, 카툰 등 다양한 장르에서 그 효과를 보여주었습니다.
Imagen 4의 결과는 최대 2K 햇상도까지 지원하며, 고품질 인쇄 및 전문 미디어 용으로도 활용할 수 있습니다.
어울러 발표에 따르면, 매우 복잡한 프롬프트까지 설명에 잘 들어맞는 이미지를 생성할 수 있다고 강조하였습니다. 또, 생성 속도가 매우 빨라서 "Preview" 버전의 경우 Imagen 3보다 10배이상 빠를 것이라고 주장하였습니다.
![]() |
![]() |
사용 방법
Imagen 4는 다음과 같이 다양한 방법으로 사용할 수 있다고 합니다.
- Gemini 와 Whisk
- 구글 슬라이드와 구글 독스 (Workspace suite 사용할 경우)
- 구글 클라우드에서 Vertex AI API를 사용하여(개발자용)
- Replicate, fal 과 같은 파트너 플랫
사용제한
구글에서 생성하는 이미지에는 눈에 보이지는 않지만 SynthID 워터마크가 포함되어 있어서, AI가 생성한 결과물임을 식별할 수 있습니다. 또한 폭력이나 차별, 가짜 정보 등을 막을 수 있도록 강력한 필터를 채택하였다고 하네요.
Gemini에서 사용하는 방법
Gemini에서는 특별히 설정할 필요 없이 생각나는 대로 프롬프트를 입력하여 사용할 수 있습니다. 물론 한글로도 생성할 수 있습니다. 예를 들어, 아래는 제가 만들어낸 프롬프트입니다.
봄의 정령들이 작은 관목과 꽃들이 가득한 정원위로 날아다니고 있다. 봄의 정령은 연두색 반투명한 옷을 걸치고 있고, 끝에 반짝이는 별이 달린 작은 막대를 들고 꽃밭 위에 빛 가루를 뿌리고 있다.
배경에 "봄의 정원"이라는 간판을 달고 있는 작은 카페가 있다.
이러한 내용의 이미지를 종횡비 16:9로 생성해줘.
봄의 정령을 2명만 남기고 어린 소녀의 모습으로 변경해줘
어린 소녀 모습의 봄의 정령이 옅은 연두색의 투명한 옷을 걸친 모습으로 바꿔줘
전체적인 구도는 그대로 유지한 상태에서 봄의 정령들의 키를 1/2로 줄여줘.
대략 이런 식으로 원하는대로 계속 수정해 가면 됩니다. 다만, 위에서 보시는 것처럼 원하는 내용 뿐만 아니라, 다른 부분도 변경이 된다는 점, 그리고 한글은 지원하지 않는다는 점을 생각하고 사용하시면 될 것 같습니다.
또한, 별 문제가 없을 것 같은데도"특정 유형의 이미지를 생성하는 방법은 아직 학습 중이므로 사용자가 원하는 이미지를 만들 수 없거나 만든 이미지가 가이드라인에 위배될 수 있습니다. 다른 요청이 있으시면 알려주세요."와 같은 메시지가 나오고 이미지가 생성되지 않는 경우가 나옵니다. 이때는 그냥 그만두고 새로운 채팅을 만들어서 새로 시작하는 것이 더 나은 것 같습니다.
Whisk에서 사용하는 방법
Imagen 3의 경우에는 Image FX에서 사용할 수 있었으나, Imagen 4는 Whisk에서 사용할 수 있습니다(Image FX에 접속해도 Whisk를 사용하라는 메시지가 나옵니다).
Whisk 에서 사용하는 방법도 Gemini에서 사용하는 방법과 거의 비슷합니다. 원하는 프롬프트를 입력하면 이미지를 2개 생성해주는데, 수정하고자 하는 내용을 입력하면 다시 이미지를 2장 생성해 줍니다.
그러다가 마음에 드는게 있어서 세밀하게 수정하고 싶을 경우에는 해당 이미지 위에 마우스를 올리고 "세부 조정"을 눌러준 후 필요한 부분을 수정하면 됩니다. 수정을 마친 후에는 오른쪽 위에 있는 X 단추를 누르면 빠져나오고요.
완성한 후, 필요하다면 [애니메이션 적용]을 눌러 동영상을 만들 수도 있습니다. 아래가 그 결과입니다. 비디오는 Veo 3로 생성되는 것 같네요.
마지막으로 네컷 만화를 그려보겠습니다. 아래는 프롬프트입니다.
가로 2개 세로 2개짜리 네컷 만화를 그려줘.
왼쪽위에는 중학생 여자아이가 침대에서 깨어나 기지개를 켜는 모습을 그려줘. 말풍선으로 "아~ 개운해"라는 말을 넣어줘.
오른쪽 위에는 욕실에서 거울을 바라보면서 치솔질을 하는 모습을 그려줘.
왼쪽 아래에는 거실에서 교복을 입고 아침을 먹는 모습을 그려줘. 말풍선속에 남자친구 얼굴을 그려줘.
오른쪽 아래에는 자전거를 끌고가는 남자친구와 등교하는 모습을 그려줘. 말 풍선으로 "잘 지냈어? 오늘 뭐할거야?"라는 말을 넣어줘.
아래는 생성된 결과입니다. 보시는 것처럼 아주 잘 생성해줍니다. 한글이 안나오는 것 빼고는요. ㅠ
그리고 이걸 3D로 바꿔본 결과입니다.
이상입니다. 구글 AI 성능이 계속 올라가는 게 눈에 보이네요.
이 글은 stablediffuision.blog의 글을 참고로하여 작성했습니다.
민, 푸른하늘