OpenAIは本日、テキストを入力してリアルな動画を生成することができる新しいAIモデル「Sora」を発表しました(The Verge)。
公式ブログによると、Soraは「複数のキャラクター、特定の種類の動き、被写体と背景の正確な詳細を持つ複雑なシーン」を作成することができ、ユーザーは最大1分までの写実的な動画を生成することができます。
新しいAIモデルは、物体が物理的な世界にどのように存在するかを理解し、「小道具を正確に解釈し、生き生きとした感情を表現する魅力的なキャラクターを生成できる」とされています。
サングラスをかけた女性が街並みの中を歩く様子。動画は公式サイトで確認可能です。
静止画像に基づいて動画を生成したり、既存の動画に欠けているフレームを埋めたり、拡張したりすることも可能で、デモ動画では、ゴールドラッシュ時代のカリフォルニアの空撮シーンや、東京の電車の中から撮影したような映像も確認できます。
Soraは現在、潜在的なリスクを評価する「レッドチーマー」に提供されているほか、フィードバックを得るために、一部のビジュアルアーティスト、デザイナー、映画制作者にもアクセスが提供されています。
生成AIの登場によって、AI画像が本物と間違えられる危険性が増加していますが、今後は動画に関しても警戒しないといけないことになりそうです。