【最新】GeminiのAPIであるVeo3で動画を生成する方法

日常パソコン部
この記事は約5分で読めます。

Geminiの最新動画生成AIモデル「Veo3」が、2025年5月25日より日本を含めた71の国と地域で利用できるようになりました。

このVeo3とは何か?どういったところが優れているのか、といったところにも軽く触れつつ、実際にどういった動画が作れるのかを見ていきたいと思います。

スポンサーリンク

GeminiのAPIであるVeo3で生成できる動画について

Veo3とは?

Veo3(ヴィーオスリー)は、Googleが開発した高品質な動画を人工知能(AI)で生成する技術です。
この機能は、GoogleのAIプラットフォーム「Gemini」に組み込まれており、ユーザーが文字で入力した内容から、リアルで自然な動画を作成することができます。

たとえば、「夕焼けの海岸を走る犬」という文章を入力すると、その場面を再現した動画がAIによって生成されます。まるで実際に撮影したかのような映像が、短時間で完成するのです。

有料版で使用することができますが、もちろん無料版でも動画の生成機能を利用することができます。ただし、無料版の場合、動画の生成回数1日3つまでとなっております。

Veo3の優れている点

1. 高精細でリアルな映像生成

Veo3は、単なるアニメーションではなく、非常にリアルな画質で動画を作成できます。
光の当たり方、風の動き、物体の質感など、細部まで自然に表現されるため、視覚的にも信頼性の高い映像が得られます。

2. 音声の自動生成機能

映像だけでなく、場面に合った効果音や背景音(BGM)も自動で生成します。
たとえば、森のシーンには小川のせせらぎや鳥の声が、都市の夜景には車の音や遠くの音楽が加わるなど、臨場感を高める工夫がされています。

3. 自然な動きと時間の流れ

従来のAI動画よりも、人物や物体の動きが滑らかで、時間の経過も自然です。
カメラワークやシーンの切り替えもAIが判断し、見やすい構成に仕上げてくれます。

4. Geminiとの連携で使いやすい

Veo3はGeminiを通じて利用できるため、特別なソフトや機材がなくても、ウェブブラウザやアプリから簡単にアクセスできます。
文章を入力するだけで動画が作れるため、初心者の方でも扱いやすい設計です。

文章から動画を生成してみた

前準備

以下の図の「動画」の部分をクリックしてプロンプトを入力することで動画の生成を行うことができます。

プロンプトを用意する

例として、次のようなプロンプトを用意してみました。

場所は神聖な日本の第32回合唱コンクール会場です。日本の小中学生の男女で結成された合唱団が「スモックのない、空が広がり、緑の山に囲まれた街の、花も木も生き生き、風がうまいよ」と日本語で唄っている。正面から撮った場面の動画を作成してください。

生成した動画がこちら

こんな動画が生成できました。
日本語の歌詞がおかしいところはご愛嬌といったところでしょうか。

画像から動画を生成してみた

前準備

前準備として「画像」タブから画像を生成します。アニメ調の少女を作ってみたいと思います。画像生成プロンプトは以下のようにしました。

2020年代風の日本のアニメ調で、セミロングの日本人の女の子が躍動感溢れるポーズを取っている

で、できた画像がこちら。

これを以下の「動画」タブの「写真を追加」のところをクリックして画像をアップロードします。

プロンプトを用意する

「動画」タブを押したあと、生成した画像を読み込みます。
そして、次のようなプロンプトで画像を動かしてみたいと思います。

少女のGEN IDを維持しつつ、この少女が拳法家のように回転しながら最後に決めポーズをする

ここで耳慣れない言葉がでてきたかと思います。「GEN ID」というのは、その画像に与えられたIDで、これを設定し忘れると元の画像から逸脱したキャラが動くこともあります。
まぁ、Geminiではここまで細かく指示しなくても動くとは思います。

生成した動画がこちら

こんな動画となりました。
勝手にフードを被ってしまうところは、プロンプト次第で修正できると思います。

1~2分で簡単に生成できる割にはかなりクオリティが高いと思いますよ。

おまけ

プロンプトを用意する

次のようなプロンプトを考えました。
結構あいまいな指示にしてみます。

若手の日本人女性インタビューアーが、ハンバーガーチェーン店の前でイケメンの40代日本人男性にハンバーガーの味についてインタビューしている。

生成した動画がこちら

簡単な指示でしたが、言いたいことはわかってくれたようです。
ただ、日本語が下手⋯(笑)
今後に期待ですね。

クオリティーはさすがですね。
この短時間でよくここまで出来たという感じです。

私が以前ご紹介した動画生成AI、Wan2.2をローカルで使ってみたって記事をご覧になりますか?こちら、5秒の動画生成に30分かけております。

最後に

いかがでしたでしょうか?
ChatGPTがすごいとか、Qwenのほうが使えるとか言ってる間にGeminiの台頭です。

この3強が今後AIの世界を支えていくのかも知れませんね。
複合型の生成AIが覇権を握ったと言えなくもありません。

今後のAI動向に注目が集まります。
とりあえずGemini、便利だぞってことをお伝えいたしました。

白川秋
白川秋

ではでは、参考までに。

コメント

タイトルとURLをコピーしました