ChatGPTに全任せ!AIとつくる、バーチャルキャラクター映像(Midjourney・Runway)

「こんな世界観の映像、作ってみたいな…」
そう思ったとき、皆さんならどうしますか?
私は迷わず、ChatGPTに丸投げしました。
こんにちは。KINTOテクノロジーズのクリエイティブ室でデザイナーをしている桃井(@momoitter)です。
この記事では、ChatGPT、Midjourney、RunwayなどのAIツールを駆使して、「しぇるぱ」というピンク髪のバーチャルキャラクターの映像を、ほぼ会話だけで形にしていった過程をまとめています。
専門的なスキルや時間がなくても、「こんな映像を作ってみたい」というアイデアさえあれば大丈夫。
AIと一緒に、そのイメージを少しずつかたちにしていくプロセスを体験してみたい方に向けて書きました。
まずは完成した映像をご覧ください。
きっかけは、1体のキャラクターの“リニューアル”
この「しぇるぱ」というキャラクターは、もともと2024年11月の社内イベント「超本部会」のために誕生したものでした。
制作過程はこちらの記事をご覧ください。
当時としては最先端のAI技術を使い、社内でも注目を集めたキャラクターでした。
……が、あれからわずか4ヶ月。画像生成AIや動画生成AIはさらに進化し、当時「すごい!」と思っていた表現が、いま見ると少し古く感じてしまうように。
そこで、「せっかくなら最新の技術で、このキャラの世界をアップグレードしよう」と思い立ち、ChatGPTと一緒に再構築を始めることにしました。
Step1 世界観の共有と画像生成
まず最初に行ったのは、キャラクターとその世界観の共有です。
もともと生成していた「しぇるぱ」の画像をChatGPTにアップロードし、こう伝えました。
このキャラクターは少し前の画像生成AI技術で作られたため、見た目をアップデートしたいです。
彼女には「バーチャルオペレーター」という設定があります。
その設定をもとに世界観を膨らませ、Midjourney v7で表現できるようなシーンのバリエーションとプロンプトを提案してください。
Midjourneyを選んだ理由は、v7にアップデートされて以降、キャラクター描写の精度や質感が大きく向上したと感じていたからです。
今回のように、既存キャラの見た目をアップグレードしたい場面にぴったりだと思いました。
するとすぐに、「その世界観なら、こういうシーンはどうでしょう?」といった具体的なシチュエーション案と、それに対応するプロンプトが次々と返ってきました。
まるで映像監督とのブレストをしているような感覚です。
試しにそのプロンプトをMidjourneyに入力してみたところ、
自分の想像をはるかに超えるビジュアルが次々と生成され、その表現力に驚かされました。
この映像を作り始めた当初は、Midjourney v7に「Omni-Reference」のようなキャラクターの一貫性を保つ機能がまだ搭載されていませんでした。
そのため、「ピンク髪のショートヘア」という分かりやすい特徴を意識的にプロンプトへ含めることで、「一貫性があるように見せる」工夫をしていました。
もしイメージと違うものが出てきても、
「もう少し顔に寄って」「背景を明るくクリーンな雰囲気に」などとChatGPTに伝えるだけで、再調整されたプロンプトを即座に出力してくれます。
Step2 画像から動画生成へ
気に入った画像が生成できたら、次はそれをChatGPTに添付し、以下のように依頼します。
この画像は提案していただいた〇〇のシーンのプロンプトをMidjourneyで生成した画像です。
この画像をRunwayのGen-4のキーフレーム機能のファーストフレームとして設定し、動画を生成したいです。
よりこのシーンが魅力的になるような、動きを加えたプロンプトを生成してください。
ChatGPTは画像の内容を読み取った上で、その魅力を最大化するRunway用プロンプトを作成してくれます。
Runwayを使った理由は、バージョンがGen-4へと進化したことによって、Midjourneyの高精細なビジュアルの魅力を損なわずに動画化できると感じたからです。
Runway Gen-4のimage to videoにMidjourneyで生成した画像をアップ。
ChatGPTが出力したプロンプトを貼り付けると、画像の世界観を最大限に引き出す高クオリティな映像が生成されました。
キャラクターやカメラの動きのイメージが違った場合も、
ChatGPTに「生成された動画はこうなっていたので、ここをこう変えてほしい」と伝えるだけで、プロンプトを再提案してくれます。
Step3 BGM選定もChatGPTと一緒に
映像のBGMを探すときも、ChatGPTが大活躍。
この世界観に合うBGMをAdobe Stockでどのようなキーワードで探せばいいですか?
と聞くと、「futuristic」「sci-fi」「cyberpunk」など、雰囲気に合ったワードをいくつも提案してくれました。
Step4 編集して完成
生成した動画とBGMをPremiere Proでつなぎ合わせ、構成・長さ・テンポ感を調整します。
シーンの切り替えにフェードイン・アウトを加えたり、音の入り方に緩急をつけたりすることで、映像全体の完成度がグッと高まります。
Midjourneyで作成した静止画と、Runwayで生まれた滑らかな動きが合わさることで、
静止画だけでは伝わりきらなかった「息づかい」や「空気感」が加わり、しぇるぱの世界観が一段とリアルに感じられるイメージビデオが完成しました。
AIと一緒に、想像をかたちにするということ
今回のプロセスで一番感じたのは、
自分の頭の中の曖昧なイメージを、ChatGPTがどんどん「言語化&具現化」してくれること。
Midjourneyでも、Runwayでも、「ちょっと違う」「もっとこう」と伝えるだけで、理想の表現に近づいていく実感がありました。
AIと一緒に進めることで、創造の幅が大きく広がることを実感できるはずです。
ぜひ一度、体験してみてください。