グーグルは6月10日、開発者向けイベント「Google I/O 2025」に生成AIを活用した演出を組み込んでいたことを明らかにした。基調講演で使用された219枚のスライドのほか、ビジュアルの48%、動画の80%にAIを使用。一部の演出については、実際のプロンプトも公開している。
スピーカー紹介動画に「Veo 2」を活用 5o2n42
各スピーカーの登壇時に流れた短い映像の制作には、同社の「AI Studio」と「Veo 2搭載Vertex AI Studio」の画像から動画への変換機能を活用。話者の写真と趣味の情報を基に作成したプロンプトをAIに与えて、手のひらの上でオレンジ色の折り鶴を浮かべたり、ギターを持った瞬間、髪の毛がモヒカンヘアーに変わったりする動画を生成した。
例えば研究者ジェイソン・バルドリッジ氏の映像では、同氏の写真とともに「“The subject is a rock star. He lifts up a double-necked guitar and begins playing. He grows a mohawk.”」(日本語訳:被写体はロックスターです。彼はダブルネックギターを持ち上げて演奏を始めます。そしてモヒカン刈りになります)というプロンプトが使われている。
オープニング映像は複数のAI技術を組み合わせて制作 1i3p5i
西部劇風の街が登場する基調講演のオープニング映像は、「Imagen 4」で動画用の画像を生成した後、「Gemini」にプロンプトの改良を依頼した上で、「Veo 3」を使って最終的な映像を生成するというステップで制作。
制作スタッフの多くは自然言語でプロンプトを入力しており、ベースとなる街の画像も「A hyperrealistic digital photography, capturing the iconic, desolate and profoundly silent main street of a forgotten 19th-century Western frontier town」(日本語訳:忘れ去られた19世紀の西部開拓時代の街の象徴的で荒涼とした、そして深い静寂に包まれたメインストリートを捉えた超写実的なデジタル写真)というプロンプトで作られているという。
また、カメラワークの変更やビジュアルの追加など、複雑な編集に対応できる生成AIの強みを積極的に活用。シーン毎の撮り直しの手間を排除することで、より迅速な作業が可能になったとしている。
