MetaのMovie Gen: AIによる映像制作の大きな進歩(しかし、まだ使えない)

MetaのMovie Gen: AIによる映像制作の大きな進歩(しかし、まだ使えない)

Metaが発表した最新のAIビデオ制作モデル「Movie Gen」は、職業的なアーティストにとって価値を失わせる懸念を含む一方で、業界における重要なマイルストーンになる可能性を秘めています。

Movie Genの機能

Movie Genは、リアルな映像を生成するだけでなく、音楽や効果音を伴った動画を16fpsまたは24fpsで最大1080p(768×768ピクセルからのアップスケール)で制作できます。ユーザーが自撮りした写真をアップロードすることで、パーソナライズされた映像を生成するのが特徴です。特に注目すべきは、簡単なテキストコマンドを用いて映像を編集できるという点です。Instagramに投稿するために自分のスマートフォンで撮影した映像を整理する際にも役立つでしょう。

現段階ではまだ研究段階

現在、Movie Genは単なる研究プロジェクトに過ぎず、Metaは一般公開を予定していません。そのため、私たちはこの技術の意味についてじっくり考える時間があります。

Metaは、Movie Genを「第三世代」の生成AI研究と位置付けています。これは、最初のメディア制作ツールであるMake-A-Sceneに続くもので、最近のLlama AIモデルを活用した厳密な研究が行われています。Movie Genは、16秒の16fpsビデオまたは10秒の24fps映像を制作できる30億パラメータのトランスフォーマーモデルによって支えられています。音声の生成に関しては、45秒間の48kHzコンテンツ(環境音、効果音、インストゥルメンタル音楽)が生成できる13億パラメータのオーディオモデルも用意されていますが、同期音声のサポートはまだ存在しません。

データソースについての懸念

Metaによると、Movie Genのトレーニングには「ライセンスされ、一般に入手可能なデータセット」が使用されており、おおよそ1億本のビデオ、10億の画像、100万時間の音声が含まれていますが、具体的なデータソースについての情報は不明確な部分もあります。過去には、Metaがオーストラリアのユーザーアカウントからデータを無断で収集したことが問題視されています。

テスト結果と受け止められ方

展示されたMovie Genの映像は一見印象的で、Metaは内部テストでOpenAIのSoraやRunwayのGen3モデルと比較して高い評価を得ていると報告しています。AIが生成した人間の映像は驚くほどリアルで、AIビデオ特有の不気味さ(目や指の不自然さ)も少ないとされています。

アーティストとの共存の重要性

Movie Genチームは、ブログ記事の中で「生成AIはアーティストやアニメーターの仕事の代替にはならない」と強調しています。彼らはこの技術が新たな表現方法を提供し、機会をもたらすと信じています。

今後、この生成AI映像が一般ユーザーにどのように利用されるかは不透明です。私たちのフィードがAI生成のビデオで溢れる時代が来るのか、それともMovie Genが個々のコンテンツを洗練させるためのツールとして利用されるのか、様々な展望が考えられます。

このように、MetaのMovie GenはAI映像制作の世界における新たな展望を切り開くかもしれませんが、その長期的な影響についてはまだ議論が必要です。

Leave a Reply

Your email address will not be published. Required fields are marked *

Translate »