AI 이미지/프롬프트 공학

악뮤 작별인사 뮤직비디오

하늘이푸른오늘 2025. 4. 6. 19:34

원래 악동뮤지션의 톡톡튀는 가사와 감성을 좋아했지만, 작별인사는 그중에서도 제일 좋아하는 노래중의 하나입니다. 

그런데 아쉽게도 이 노래는 뮤직비디오가 없더군요. 그냥 파란 하늘같은 이미지에 노래가사만 나오던가, 두분이서 노래부르는 모습을 촬영한 영상만 있을 뿐이었습니다.

그래서 한번 만들어 보기로 했습니다. 요즘 ChatGPT에서 이미지 생성기능이 엄청 좋아졌거든요. 예전에도 한번 시도해 본적이 있었는데, 그때는 DALL-E 3로 생성하는데다가 한번 생성한 후, 다음 그림과의 일관성이 유지가 안되어서 그림 스타일이 들쭉날쭉하는 바람에 실패했거든요.

가사 정리하기

일단 가사는 아래와 같습니다. 전체 가사 없는 부분까지 포함해서 전체 14x4= 56 마디로 구성되어 있는데, 보시는 것처럼 일정하지를 않네요. 오늘 처음 알았습니다. 

1.  전주 6 마디
2. 떠날 때 창틀에/화분이 비었길래/뒤 뜰의 꽃을/옮겨 담았어요/제라늄 꽃/을/ (6마디)
3. 떠날 때 책장에/먼지가 쌓였길래/책 하나 속에/꽂아두었어요/짧은 편지/를 (6마디)
4. 정든 찻잔도/색이 바랜 벽지도/흔적이 힘들어서/바꾸지 말아요/(4마디)
5. 내 마음에/도/ 같은/것들을/남긴 것처/럼/ (6마디)
6. 간주 6마디
7. 떠날 때 문턱에/나비가 앉았길래/넘지 못하고/ 바라보았어요/ (4마디)
8. 떠날 때 발등에/개미가 올랐길래/걸음 멈추고 /나누었어요 /작별 인사/를(6마디)
9. 정든 찻잔도/물기 배인 마루도/의미를 알기 전에/ 바꾸지 말아요/(4마디)
10. 내 마음에도/ 같은/것들을/남긴 것처/럼/음음/음음음(6마디)

이미지 생성 준비

4마디 짜리는 1개의 씬으로 구성하고 6마디 짜리는 2개의 씬으로 구성해서 총 17개의 이미지를 만드는 걸로 했고, 단, 전주와 간주는 동일한 이미지를 사용할 생각이니 총 15개의 이미지를 생성해야겠네요. 전체적인 느낌은 분위기상 수채화 스타일로 하는 게 좋을 것 같다고 생각이 드네요.

1-1번 씬 : 작은 소년과 소녀가 한적한 시골집에서 꽃밭을 가꾸고 있다.
1-2번 씬 : 작은 소년과 소녀가 꽃밭에서 나비를 뒤쫒아간다. 

2-1번 씬: 작은 소녀가 꽃밭에서 제라늄 꽃을 화분에 옮겨 담는다.
2-2번 씬: 소녀가 제라늄꽃 화분을 창가에 올린다.

3-1번 씬: 작은 소녀가 먼지 쌓인 책장을 쓰다듬는다.
3-2번 씬: 작은 소녀가 편지를 쓴다.

4번 씬: 작은 소녀가 집안에서 창밖을 내다보며 찻잔을 들고 밖을 바라보고 있다. 

5-1번 씬: 작은 소녀가 슬픈 얼굴로 가슴에 손을 올리고 노래를 부른다.. 
5-2번 씬: 작은 소녀가 슬픈 얼굴로 가슴에 손을 올리고 노래를 부른다.(다른 각도)

6-1번 씬 : 작은 소년과 소녀가 한적한 시골집에서 꽃밭을 가꾸고 있다. (1-1번 씬과 동일)
6-2번 씬 : 작은 소년과 소녀가 꽃밭에서 나비를 뒤쫒아간다. (1-2번 씬과 동일)

7번 씬 : 나무 문턱에 나비가 앉아있고, 작은 소녀가 물끄러미 바라본다.

8-1번 씬: 소녀의 발등에 개미가 꼬물거리며 기어간다. 
8-2번 씬: 소녀가 앉아 개미를 쳐다본다.

9번 씬: 작은 소녀가 집안에서 창밖을 내다보며 찻잔을 들고 밖을 바라보고 있다. (4번 씬과 동일)

10-1번 씬: 작은 소녀가 슬픈 얼굴로 가슴에 손을 올리고 노래를 부른다.
10-2번 씬: 작은 소녀가 슬픈 얼굴로 가슴에 손을 올리고 노래를 부른다.(다른 각도)

대충 이렇게 구상을 했지만, ChatGPT에는 다음과 같이 명령을 주었습니다.

내가 총 15장의 이미지를 생성하려고 해. 소년을 사랑하던 소녀가 헤어지면서 느끼는 감정을 표현하는 그림들이야. 소년과 소녀는 동일한 인물이어야 하고. 모든 이미지를 따뜻하지만 차분한 느낌의 수채화 스타일로, 무엇보다 중요한 건 일관성을 유지하는거야.

생성된 이미지

새로 프로젝트를 생성하고(유료 회원으로 가입했습니다), 그 다음 위의 명령을 주니, 여러가지 조언을 해주더군요. 일단 그걸 보면서 한장씩 생성을 하고 수정을 하는 방식을 거쳤습니다. 아래는 결과입니다.

생성된 이미지중 일부는 마음에 안들어서 새로 생성하기도 했는데, 여러번 명령을 해도 마음에 안들 때는 포토샵을 사용해서 편집하기도 했습니다.

(전주 1)
1-1(1)번 씬 : 작은 소년과 소녀가 한적한 시골집에서 꽃밭을 가꾸고 있다.
(전주 2)
1-2(2)번 씬 : 작은 소년과 소녀가 꽃밭에서 나비를 뒤쫒아간다. 
(떠날 때 창틀에/화분이 비었길래)
2-1(3)번 씬: 작은 소녀가 꽃밭에서 제라늄 꽃을 화분에 옮겨 담는다.
(뒤 뜰의 꽃을/옮겨 담았어요/제라늄 꽃/을/)
2-2(4)번 씬: 소녀가 제라늄꽃 화분을 창가에 올린다.
(떠날 때 책장에/먼지가 쌓였길래/)
3-1(5)번 씬: 작은 소녀가 먼지 쌓인 책장을 쓰다듬는다.
(책 하나 속에/꽂아두었어요/짧은 편지/를)
3-2(6)번 씬: 작은 소녀가 편지를 쓴다.
(정든 찻잔도/색이 바랜 벽지도/흔적이 힘들어서/바꾸지 말아요)
4(7)번 씬: 작은 소녀가 집안에서 창밖을 내다보며 찻잔을 들고 밖을 바라보고 있다. 
(내 마음에/도/ 같은)
5-1(8)번 씬: 작은 소녀가 슬픈 얼굴로 가슴에 손을 올리고 노래를 부른다.
(것들을/남긴 것처/럼/)
5-1(9)번 씬: 작은 소녀가 슬픈 얼굴로 가슴에 손을 올리고 노래를 부른다.(다른 각도)
(간주 1)
1-1(1)번 씬 : 작은 소년과 소녀가 한적한 시골집에서 꽃밭을 가꾸고 있다.
(간주 2)
1-2(2)번 씬 : 작은 소년과 소녀가 꽃밭에서 나비를 뒤쫒아간다. 
(떠날 때 문턱에/나비가 앉았길래/넘지 못하고/ 바라보았어요/)
7(10)번 씬 : 나무 문턱에 나비가 앉아있고, 작은 소녀가 물끄러미 바라본다.
(떠날 때 발등에/개미가 올랐길래/걸음 멈추고)
8-1(11)번 씬: 소녀의 발등에 개미가 꼬물거리며 기어간다. 
(나누었어요 /작별 인사/를)
8-2(12)번 씬: 소녀가 앉아 개미를 쳐다본다.
(정든 찻잔도/물기 배인 마루도/의미를 알기 전에/ 바꾸지 말아요/)
4(7)번 씬: 작은 소녀가 집안에서 창밖을 내다보며 찻잔을 들고 밖을 바라보고 있다. 
(내 마음에도/ 같은/것들을)
10-1(13)번 씬: 작은 소녀가 슬픈 얼굴로 가슴에 손을 올리고 노래를 부른다.. 
남긴 것처/럼/음음/음음음)
10-2(14)번 씬: 작은 소녀가 슬픈 얼굴로 가슴에 손을 올리고 노래를 부른다.(다른 각도)

비디오 생성

위의 이미지를 사용해 비디오를 생성했습니다. 비디오는 소라(유료 회원만 사용가능)와 Hunyuan Video의 이미지-비디오 기능을 이용했습니다.

그런데 두가지 모두 단점이 있었습니다. 소라의 경우엔, Image를 받아들이기는 하는데 프롬프트를 함께 지정할 수 없었습니다. Hunyuan Video의 경우 원래 이미지는 수채화 스타일인데 선이 깨끗해져서 스타일이 약간 변경되더군요. 그래서 일단 따로따로 생성을 했습니다. 소라는 mp4로 저장했고(다른 옵션이 없었습니다) Hunyuan은 webp 포맷으로 저장했는데, 제가 사용하는 비디오 편집 프로그램 DaVinci Resolve에서 webp는 받아들이지 않아서 다시 mp4로 포맷을 바꿨습니다.

아래는 이렇게 생성된 비디오들입니다. 너무 5초짜리 비디오들인데 티스토리에선 20MB가 한계라 안올라가는 것도 있고... 모두 올릴 필요도 없어서 그냥 스크린 샷으로 대체합니다.

그 다음 이 비디오 클립들을 무료 비디오 편집프로그램 DaVinch Resolve를 사용해 편집했습니다. 아내는 결과입니다. 

짧은 생각

예전부터 동영상 만드는 건 엄청 힘든 일이라는 걸 알고 피했습니다만, 이번엔 어쩔 수 없이 만들어 봤습니다. 물론 많이 힘들었습니다. 동영상 편집 도구 사용법을 배우는 건 뭐... 그냥 그냥 할 수 있었지만, 영상을 만드는 원리 같은 것을 모르는 상황에서 덤비다보니 시행착오가 많을 수 밖에 없었습니다.

일단 제가 이 영상을 만들면서 느낀점 몇가지만 정리하겠습니다.

  • 2마디마다 영상을 바꾸거나, 적어도 변경이 되어야 좋을 것 같다.
  • 그러기 위해서는 좀더 가사 준비를 신경쓰는 게 좋겠고, 좀더 자세하게 영상을 설명할 수 있도록 하는 게 좋겠다.
  • Sora 가 생각보다 영상을 잘 만들지 못했다. 특히 이미지와 함께 Prompt를 자동생성해주는데 이게 따로 놀아서 이상한 영상이 만들어졌다. Prompt는 지우고 원하는 영상이 나올때 까지 반복 생성하다보니, 심지어는 한 40개 정도(한번에 4개 * 10번) 생성한 경우도 있었다.
  • Hunyuan은 이미지 스타일을 바꾸는 바람에... 완전 수채화 스타일을 선이 강한 그림으로 바꿔서 다음엔 다른 AI 모델을 사용하는 게 좋을 것 같다.
  • 무엇보다 DaVinch Resolve를 조금더 공부해서 비디오 편집에 대해 좀 더 자세히 알고 다시 시도해 봐야겠다.

이상입니다. 다음번에는 좀더 그럴듯하게 만들어서 돌아오겠습니다.