Googleの最新AI Veo。テキストや画像からフルHD動画を生成。 / いがわ

.

Memo

GoogleのAI Veo。テキストや画像から動画を生成。YouTube動画も可能。

Veoによる、テキストから動画生成 – Text to Video。

Googleの動画生成AI Veo。

60秒超の動画も生成。

Veoのデモは、Google DeepMindのページから、生成動画を見ることができる。

OpenAIのSoraのときと同様、すでにもう実写と見分けがつかないほどのクオリティ。

参照元:Veo – Google DeepMind

Veo 2が登場。

2024.12.19 追記)

Veo 2がリリース。4Kまでの解像度の動画を作成でき、品質が高く、実写のようなリアルなものからアニメ調のものまで、さまざまなテイストでのスタイルや、被写界深度やレンズ、フィルムなどのカメラコントロールの精度も上がっているとのこと。

MovieGenBenchというMeta社によるベンチマークでは、OpenAI社のSoraよりも高い性能らしい。

これらは、MacとWindowsやiPhoneとAndroidなどと同様、リリースやアップデートにより競争になっていくと思われる。

参照元:Veo 2 – Google DeepMind

Veo 2のデモ。

Veo 2 demo | Cartoon girl

ピクサーやディズニーのアニメと見分けがつかない。

プロンプト:
Prompt:The camera floats gently through rows of pastel-painted wooden beehives, buzzing honeybees gliding in and out of frame. The motion settles on the refined farmer standing at the center, his pristine white beekeeping suit gleaming in the golden afternoon light. He lifts a jar of honey, tilting it slightly to catch the light. Behind him, tall sunflowers sway rhythmically in the breeze, their petals glowing in the warm sunlight. The camera tilts upward to reveal a retro farmhouse with mint-green shutters, its walls dappled with shadows from swaying trees. Shot with a 35mm lens on Kodak Portra 400 film, the golden light creates rich textures on the farmer’s gloves, marmalade jar, and weathered wood of the beehives.
 
プロンプトの日本語訳:カメラはパステルカラーに塗られた木製の蜂の巣の列の間をゆっくりと進み、羽音を立てながらミツバチがフレーム内外を行き来します。カメラの動きは、中央に立つ洗練された農夫に落ち着きます。農夫の真っ白な養蜂服は、午後の黄金色の光の中で輝いています。農夫は蜂蜜の瓶を持ち上げ、光を集めるために少し傾けます。農夫の後ろでは、背の高いヒマワリがそよ風にリズミカルに揺れ、花びらは暖かい日差しの中で輝いています。カメラが上を向くと、ミントグリーンのシャッターが付いたレトロな農家が映し出され、その壁には揺れる木々の影がまだらに映っています。コダック ポートラ 400 フィルムの 35mm レンズで撮影されたこの映像では、金色の光が農夫の手袋、マーマレードの瓶、そして蜂の巣の風化した木材に豊かな質感を生み出しています。
Veo 2 demo | Beehive

こちらも実写映像と見分けがつかない。

そのため、AI生成動画であることがわかるように、SynthIDによる目に見えない透かし(ウォーターマーク)が埋め込まれる。

プロンプト:
Prompt:This medium shot, with a shallow depth of field, portrays a cute cartoon girl with wavy brown hair, sitting upright in a 1980s kitchen. Her hair is medium length and wavy. She has a small, slightly upturned nose, and small, rounded ears. She is very animated and excited as she talks to the camera..
 
プロンプトの日本語訳:被写界深度が浅いこのミディアム ショットは、1980 年代のキッチンにまっすぐ座っている、ウェーブのかかった茶色の髪をしたかわいい漫画の女の子を描いています。彼女の髪は中くらいの長さでウェーブしています。彼女の鼻は小さく、わずかに上向きで、耳は小さく丸みを帯びています。彼女はカメラに向かって話すとき、とても生き生きと興奮しています。


Veoの使い方について。

Soraと同じく、基本的な使い方は、テキストからAI動画を生成する「Text to Video」の形式。

最大60秒超の長さまでの動画生成が可能。

関連:OpenAIからSora(動画生成AI)が広がる。デモやWebCMから一般公開へ。

高解像度対応の画質。

解像度は1920×1080ピクセルと、テレビやパソコンでよく使われるフルHD(フルハイビジョンへも対応している。

veo 2は4Kへも対応。

YouTube ショート動画へも。

2025年には、Veo 2の機能をYouTube ショートやその他の製品にも導入する予定とのこと。

Veoの読み方について。

いまのところ、Veoは「ヴェオ」ではなく「ベオ」と表記されていることが多い。

Geminiのときも発音的には近い「ジェミナイ」ではなく、すでに一般的に使われていた「ジェミニ」となったので、このまま「ベオ」となりそうな感じがする。


Veoによる、画像から動画生成 – Image to Video

画像から動画を生成 – Image to Video

Veoで画像生成と動画生成。

Meta社の生成AI「Llama 3(ラマ 3)」へのオマージュなのか、下記の動物は「ラマ」ではなく、3匹の「アルパカ」。

左側がVeoによる生成画像で、右側がVeoによる生成動画。

参照元:Veo – Google DeepMind

画像のプロンプト。

Prompt: 「Alpacas wearing knit wool sweaters, graffiti background, sunglasses」
プロンプト(日本語訳): 「ニットウールのセーター、落書きの背景、サングラスを着たアルパカ」

動画のプロンプト。

Prompt: 「Alpacas dancing to the beat」
プロンプト(日本語訳): 「ビートに合わせて踊るアルパカ」


Veoの利用方法。

Veoの利用は「Waitlist(順番待ちリスト)」から。

Veoが使えるのはいつから?

現在はまだ順番待ちの状態。まず、Googleアカウントで labs.google/fxの順番待ちリストへ登録をする。

Veoのwaitlist登録の画面。

VeoのWaitlist登録方法。

Google LabsのVideoFXから進む。

Googleのアカウントを用意し、

  1. Googleへログイン。
  2. Google フォームで送信。

という流れとなっている。

現時点では、ImageFXはアメリカに拠点を置く18歳以上のユーザーのみへの限定。)

参照元:labs.google/fx

利用規約の確認。

Veoの使用と、Googleの利用規約。年齢制限もあるので注意が必要。

参照元:Google 利用規約 – ポリシーと規約 – Google

プライバシーポリシーの確認。

Veoの使用と、Googleのプライバシーポリシーも同様。

参照元:プライバシー ポリシー – ポリシーと規約 – Google

Veo。テキストや画像から動画生成するアルパカ。

以上、参考になれば幸いです。


Webデザインは実務数年、職業訓練校講師数年、フリーランス数年、計15年以上のキャリアがありますが、一気にがぁっと書いているので「です・ます調」ではありません。(元々はメモ書きでした。) 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ訂正いたします。 写真は主にUnsplashPixabayのフリー素材を利用させていただいております。その他の写真や動画もフリー素材やパブリックドメイン、もしくは自前のものを使用しております。

井川 宜久 / Norihisa Igawa
デザイナー、ディレクター、講師、コーチ / 井川宜久

AI 関連メモ。

ChatGPT 関連メモ。

DALL·E 関連メモ。

Sora 関連メモ。

Gemini 関連メモ。

Copilot、Bing 関連メモ。

Llama 関連メモ。

Claude 関連メモ。

Perplexity 関連メモ。


免責事項について

  • 記事ページ(Memosのページ)は当初は文字通りメモ書きでした。その後、修正や更新をしております。
  • 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ早急に対応いたします。
  • 一個人のポートフォリオサイトですので、万一損害・トラブル等が発生した場合でも、一切の責任を負いかねます。