今月初め、イーロン・マスク、アレクサンドリア・オカシオ=コルテス、ジョー・バイデン大統領、ドナルド・トランプ元大統領が出演するフランス映画の新しい映画予告編が、以前はツイッターとして知られていたプラットフォームであるXに投下された。ジャック・ドーシーはバゲットを抱えたパン屋を演じ、ティム・クックもめまいがするトロリーの乗客としてカメオ出演している。
もちろんこの予告編はフェイクです。 @trbdrk という名前のユーザーが作成した、La Baye Aréa (ベイエリア) というタイトルの AI 生成パロディはすぐに拡散し、多くのユーザーが最初は驚くべき AI 効果にだまされたとコメントしました。
AI によって生成されたコマーシャルや映画の予告編は、テキストからビデオへの生成テクノロジを扱うユーザーにとって人気のプロンプトです。しかし、1 年前の外観と比較すると、製品の品質はほぼあらゆる面で大幅に向上しています。このビデオは明らかにパロディですが、ユーザーが現実の状況を再現するビデオを生成することを想像するのは突飛なことではありません。この能力は新たな可能性を刺激するだけでなく、実際の結果をもたらす可能性もあります。
ここ数年、AI ツールをいじり続けてきたフルタイムのクリエイターとして、私は実際の人工知能を見つける方法と、コンテンツの生成にどのツールが使用された可能性が高いかを学びました。ここでは、La Baye Aréa のようなビデオを作成する方法と、インターネットを閲覧する際に注意すべき点を説明します。
声
受賞歴のある CNET の編集チームと協力して、さまざまな視点からユニークなコンテンツを提供する業界のクリエイター、寄稿者、新進の思想的リーダーを紹介します。
La Baye Aréa のようなビデオの作成に使用される AI ツール
La Baye Aréa のようなビデオは、ユーザーが現在アクセスできる 3 つの生成 AI ツールを使用して作成できます。
- 滑走路 Gen-3: Runway は自然言語と画像プロンプトからビデオを生成し、Gen-3 は 6 月に登場しました。ランウェイは今月初めにライオンズゲートと契約を結んだ。
- 旅の途中6。 Midjourney は、自然言語プロンプトを画像に変換する生成 AI プラットフォームです。最初に画像を使用してビデオのストーリーボードを作成し、次にそれらの画像を Runway などのプロンプトに提供すると、必要な出力が確実に得られるようにすると便利です。
- 共有: Midjourney (画像) や Runway Gen-3 (ビデオ) とは異なり、Udio は AI による音楽作成に特化しています。
このようなビデオを個人的に再作成するにはどうすればよいか考えました。プロセスを分解する私の試みは次のとおりです。
- Midjourney を使用してコンセプトとストーリーボードを作成します。
- Runway Gen-3 を使用して、これらの静止画像をビデオ シーケンスに変換します。
- ビデオ コンテンツのギャップやトランジションを特定し、Runway Gen-3 で追加のシーンを生成します。
- Udio を使用して、必要なサウンドトラックと効果音を作成します。
- 選択したビデオ編集ソフトウェアですべての要素を組み合わせ、オーディオとビデオを同期させて、最終製品を作成します。
これらの手順は簡単に見えるかもしれませんが、La Baye Aréa はおそらくより洗練されたものでした。また、ビデオには対話が含まれていないため、労力が増加することにも注意してください。
AI によって生成されたビデオを見つける方法
ビデオの作成に使用されるツールと考えられる制作プロセスについて説明しました。次は、AI によって生成されたビデオを見分けるための目と耳を訓練しましょう。
まず、顔の表情の不一致、不自然な身体の動き、前景、背景、トランジションにおけるアーティファクトや不具合などの視覚的な手がかりを探します。これらのキャラクターが目を瞬いたり、唇を動かしたりするので、不具合を簡単に識別できます。ここでいう不具合とは、目の瞬きや瞬きの間の移り変わり、体の動かし方における不自然な動きを意味しており、ロボットのように見えたり、一貫性がなかったりすることもあります。 AI のビデオとオーディオが時間の経過とともに改善されるにつれて、これらの不具合はより微妙になり、検出が困難になります。
言葉でうまく説明できなくても、不具合を見つけることができる場合があります。これはよくあることです。科学雑誌『Human Movement Science』に掲載された記事では、人間の自然な動作は神経運動制御、生体力学、適応性の複雑な相互作用によって生み出されることがわかりました。平たく言えば、人間の動きは微妙であり、私たちの目は言葉で表現できる以上のものを識別することがよくあります。
次に、口パクの不一致、背景のノイズ、音声パターンやアクセントの不自然なイントネーションなどの音声の手がかりを探します。イントネーションが私にとって最も明白な手がかりであることがよくあります。イントネーションとは、特に音声のピッチの上昇と下降を指します。これは、質問と発言を区別する場合などに意味を伝える方法であり、英語だけでなくすべての話し言葉に存在します。音声パターンとは、イントネーションだけでなく、リズム、ピッチ、呼吸の休止など、より幅広い要素を指します。これらの明らかな、そして場合によっては微妙な違いに気づくと、AI によって生成されたビデオを簡単に見分けることができるようになります。
最後に、文脈上の手がかり、つまり音声と視覚の不一致を超える要素があります。私たちは多くの場合、自分自身の経験、知識、論理を通じて偽のコンテンツを区別します。 『ラ・バイ・アレア』では、キャストは不条理であり、明らかにパロディである。ただし、登場人物とその人物の実生活の年齢との年齢差にも注意してください。その理由の 1 つは、AI が何年も前の写真やビデオを使ってトレーニングされることが多いためです。
最終的には、AI ビデオが非常に優れたものになり、そのような俳優が特定の映画や他の作品に出演したかどうかを検証する必要が生じるでしょう。 IMDB と Google 検索は、私たちの多くが検証のために利用できるリソースであり、通常は複数のソースから情報を収集することをお勧めします。
AI によって生成されたビデオを見つけることが重要なのはなぜですか?
責任ある AI という用語を聞いたことがあるかもしれません。これは、AI の設計、開発、展開、使用の指針となる一連の原則を指します。 La Baye Aréa は AI によって生成されたビデオであることが簡単にわかりましたが、作成者はこれを AI コンテンツであると明確にラベル付けしました。この承認は、視聴者にとって、推測や憶測を必要とせずに役立ちます。
しかし、クリエイター、組織、政治団体が AI コンテンツを開示しないことを選択した場合はどうなるでしょうか?それは本当に問題になる可能性があります。近年見てきたように、未公開の AI や捏造されたコンテンツは、国民の信頼の低下、操作的な誤った情報の拡散、倫理的および法的な重大な懸念につながる可能性があります。
AI が現在どのような機能を備えているかを理解すればするほど、教育を受けた思想家のコミュニティとしての地位が向上します。企業が責任ある AI を実践する必要があるのと同じように、私たちにもその機能と限界を学ぶ責任があります。
AI について詳しく知る
幸いなことに、つながりを保ち、情報を得るには多面的な方法があります。日常生活のためにいくつかの AI ツールを学習することを検討してください。 ChatGPT、Perplexity、Claude、Google Gemini などのアクセス可能な無料ツールを使用して、質問し、回答を求めます。また、あなたが私のようなクリエイターである場合は、クリエイターがすでにどのような AI ツールを使用しているかを学んでください。
成長を続ける AI の世界をナビゲートし続ける上で、この記事が役立つことを願っています。今後、これらのツールやサービスについてさらに詳しく知りたい場合は、私の YouTube チャンネルにお越しください。