AI 이미지/AI 서비스

구글 Whisk에서 고양이 비틀즈 생성하기

하늘이푸른오늘 2025. 5. 26. 01:33

고양이 비틀즈가 Abbey Road를 건너가는 모습을 생성하려고, 여느 때처럼 구글 Image FX에 접속하자, 아래와 같이 새로운 실험 서비스인 Whisk를 사용해 보라는 알림이 떴습니다. 물론 바로 접속해서 생성을 시도했습니다.

이 글에서는 이미지를 생성하고, 생성된 이미지를 다시 비디오로 생성하는 과정을 보여드립니다.

이미지 생성

맨 먼저 "의인화 고양이 Beatles가 Abbey road 횡단보도를 건너간다."라고 프롬프트를 주고 생성한 결과입니다. 두 장이 생성되는데, 그럴 듯한 것을 선택했습니다.

이미지 좌측 위를 보면 애니메이션으로 바꾸는 기능과 세부 조정하는 기능이 있습니다. 일단 위의 이미지를 약간 수정하기로 하고 "세부 조정"을 눌렀습니다.

그뒤, 고양이 품종을 다양하게 하라, 앞쪽 두마리에도 꼬리를 달아달라, 그리고 손발은 고양이 손발로 바꿔라... 등으로 여러번 수정을 했습니다. 아래가 그 결과입니다. 참고로 변경하다가 마음에 안드는 결과가 나오면 지워버리고 새로 수정하면 됩니다.

최종 결과를 클릭하면 아래와 같은 프롬프트를 확인할 수 있습니다. 자세히 읽어보시면 이미지에 대한 자세한 설명이 포함되어 있음을 알 수 있습니다.

Four figures with the heads and tails of cats and human bodies with cat paws for hands and feet walk barefoot across a crosswalk with black and white stripes. They move from left to right, occupying the lower half of the frame, and all face towards the right side of the image.

The figure on the far left has the head of a light-toned tabby cat with stripes and cat paws. They also have a long tabby cat tail extending behind them. They wear a light blue denim jacket over a white collared shirt and light blue denim pants. Their arms swing slightly as they walk.

The second figure from the left has the head of a white Persian cat with long fur and cat paws. They also have a long, striped tail trailing behind. They wear a light blue suit jacket over a blue and white patterned collared shirt, paired with blue jeans. Their right arm is slightly forward, and their left arm swings back.

The third figure has the head of a dark gray or black cat with cat paws. They also have a long dark gray or black tail extending behind them. They wear a dark gray or black suit jacket and matching dark pants. A white collared shirt is visible beneath the jacket. Their left arm swings forward, and their right arm swings back.

The figure on the far right has the head of a light brown and white cat with cat paws. They also have a long light brown and white tail extending behind them. They wear a white suit jacket and matching white pants. A white collared shirt is underneath the jacket. Their left arm swings forward, and their right arm swings back.

The crosswalk spans a street with multiple lanes of traffic. Several cars are visible parked along the side of the road and driving in the distance. Lush green trees line both sides of the street, suggesting a park or residential area. Buildings of a light brown or tan color with architectural details are visible in the background on the right side of the frame. The sky above is bright, suggesting daytime. The lighting appears to be natural sunlight, casting soft shadows.

비디오 생성

이제 오른쪽 위의 X 버튼을 누르면 아래와 같이 이제까지 생성된 모든 이미지를 볼 수 있습니다.

마지막 이미지에서 "애니메이션 적용"을 누르면 비디오 생성모드로 들어갑니다. 여기에서 프롬프트에 비디오로 생성하고자 하는 내용을 입력합니다. 물론 생성과정에서 마음이 안들면 지우고 새로 생성하면 됩니다.

아래는 이렇게 해서 생성한 비디오입니다. (mp4를 webp 포맷으로 변환했습니다)

짧은 감상

처음 써봤지만 꽤 인상적입니다. ChatGPT나 Gemini에서 대화식으로 이미지를 생성하고 수정할 수 있기 때문에 Whisk가 새로울 것은 없지만, 제가 보기에는 이미지 및 비디오를 생성하는데 위의 일반 AI 챗봇 보다는 뛰어난 것 같습니다.

  • 이미지/비디오 생성 전용이라서 다른 AI 챗봇보다 이미지/비디오 생성에 전문적인듯 합니다.
  • 무엇보다 이미지를 생성하고, 다시 비디오를 생성할 수 있다는 점이 편리합니다.
  • 그리고 현재는 실험 수준이라서 그렇겠지만, 생성속도가 무척 빠릅니다. 이미지는 4-5초 수준, 비디오도 15초 정도?면 생성됩니다.

앞으로 어떻게 될지는 모르겠지만, 당분간은 이 서비스를 자주 사용할 것 같네요.

이상입니다.

민, 푸른하늘