【映像の未来終焉か】OpenAI Sora、最長1分生成の衝撃。動画生成AIは新時代へ突入

AI・テクノロジー

ChatGPTを生んだOpenAIが、動画生成AIの「Sora(ソラ)」を発表し、世界中のクリエイター界隈に激震が走っています。従来のAI動画が抱えていた「AIっぽい不自然さ」を解消し、なんと最長1分の超高品質な動画を生成できるSoraの登場は、私たち映像制作者の未来を本当に脅かすのでしょうか?

本記事では、Soraの驚異的な機能と技術、そして大手IT企業が本格参入し競争が激化する動画生成AI市場の現状を解説。AI時代にクリエイターが「生き残る」ためではなく「アップデート」するために必要な視点について深掘りします。


? I. 「AIっぽさ」を払拭!Soraの驚異的なクオリティに集まる視線

OpenAIが開発した動画生成AI「Sora(ソラ)」は、そのデモ動画が公開されて以来、大きな注目を集めています。

実際にSoraが作った動画を見て、一番衝撃を受けたのが、「既存の動画生成AIと比べても、かなり精度の高い印象を受けます」という点です。今までの動画生成AIって、一見して「AIっぽいな」という違和感や、途中で映像が崩れてしまうのが弱点でした。でもSoraは、その不自然さが本当になくなっているんです。動画によっては「これ、本物とちょっと見分けつかないな」と感じるほどのクオリティに達しているものもあります。

Soraが発表された際、国内の大手ニュースメディア(WBS、Yahoo Newsなど)がこの動画生成AIを取り上げました。「国内のニュースメディアが動画生成AIを取り上げたことって過去なかったように思うんですね」という発言からもわかるように、ChatGPTをリリースしたOpenAIという背景があるからこそ、異例の注目度を集めています。

Googleの「不自然なAI動画を葬る」対抗馬、Lumiereの実力

⏱️ II. 最長1分生成の衝撃!Soraの機能と応用範囲

Soraの機能面で最も注目すべきは、生成できる動画の長さです。なんと「空で作れる動画の長さが最長1分ですね」。他の動画生成AIサービスの平均が約4秒程度であることを考えると、この1分という長さは驚きです。動画生成AIは時間が長くなればなるほど動画の破綻が多くなるという技術的な課題があったため、この長時間・高品質は大きなブレイクスルーと言えます。

Soraは主にテキスト・トゥ・ビデオですが、画像や動画を元に動画を生成するマルチモーダルな機能も備わっています。例えば、山の中のスポーツカーの動画をSoraにかけて、周囲の風景をジャングルに差し替えるといった応用が可能です。

さらに、Soraは横長だけでなく、YouTubeショートやTikTokのような縦長の動画(さまざまなアスペクト比)にも対応。ドローンが途中で蝶に変わるといった、動画と動画を繋ぐ合成機能も、創造性の幅を大きく広げてくれます。


? III. 技術的支柱と今後の利用見込み

Soraが高いクオリティを実現できる技術的な背景として、Soraがユーザーのプロンプト(指示)の文脈を理解するだけでなく、「物理的な世界でどのように起こるのかっていうのも理解している」点が公式で示されています。例えば、水をこぼせば流れる、ボールを投げれば放物線を描くといった、現実世界の法則性をAIが再現できているというわけです。

Soraの開発のベースにあるのは、DALL-E 3やGPTモデルといったOpenAIがこれまで積み上げてきた研究(TransformerやDiffusion Modelの応用)なんです。これらの技術が動画生成に適用され、特にDiffusion Transformer(DiT)のようなアーキテクチャ(動画の整合性を高める技術)が、その物理的な整合性を支えていると見られています。

現時点では、Soraはまだ一般の人は利用できません。しかし、OpenAIが過去にDALL-E 3をChatGPT上で開放した事例から、SoraもいずれはChatGPTプラス(有料プラン)のユーザーから順次利用が開放される可能性が高いでしょう。2024年中のリリースに期待したいところです。

「AIゆり子」の感情を持つリアルな声を生み出すTTS技術の最前線

? IV. 動画生成AI市場の勢力図激変と競争の現状

Soraの発表により、動画生成AI界隈は「役者が揃ってきた感じ」があります。もともとGoogleやOpenAIといった大手IT企業は参入していませんでしたが、2024年に入ってからGoogleがLumiereを発表し、続いてOpenAIがSoraを投入したことで、市場の競争は一気に激化しました。

主要なプレイヤーは、OpenAI(Sora)、Google(Lumiere)、Meta(M-Video)の巨大企業に加え、Runway(Gen2)やPikaLabo(Pika 1.0)といったスタートアップも高いクオリティでしのぎを削っています。現時点ではRunwayのGen2やPika 1.0などが、一般ユーザーが試せるトップクラスのサービスです。

「無料で使える罠」として話題の高性能AI、Dream Machineの商用利用の注意点

? V. AIは仕事を奪うのか?クリエイターの仕事の「アップデート」

Soraのような高性能な動画生成AIが出てきたとき、多くの人が「動画に携わる人たちが失業するのではないか」という懸念を抱きます。

これに対して、「私個人としてはむしろアップデートしていくのではと思っています」とポジティブな見解が示されています。AIの進化は、クリエイターの仕事を奪うのではなく、「AIに精通した人間が仕事を奪う」という構図を作り出す可能性が高いです。

AIを活用することで、個人や企業が手軽に動画生成できるようになり、業務の効率化が図れるほか、現実では不可能な空想的な動画も制作できるようになり、創造の幅が広がります。

AIが生成した動画が一般化した時、「AIが作った動画に価値やですね。注目が集まる時期っていうのは割とすぐ終わりそうなのかなと思ったりしています」。最終的に勝負を決めるのはクオリティであり、動画の品質を左右する人間の感性やスキルは変わらず重要であるため、映像制作の核となる部分は人間の手が必要であり続けると考えられます。要は、最終的に問われるのは、道具(AI)ではなく、それを使う人間の感性と発想力なのです。

Photoshopのように音楽を編集する時代。Adobe AIが暴く「声」の無法地帯
月1200曲無料の破格条件で音楽市場を破壊するUdioの脅威

まとめ

  • OpenAIはテキスト・画像・動画から最長1分の動画を生成できるAI「Sora(ソラ)」を発表しました。
  • Soraは従来のAIの弱点であった動画の破綻や不自然さが少なく、プロンプトの文脈や物理的な世界を理解しているため、高品質な動画を生成できます。
  • Soraの登場により、Google Lumiereなど大手IT企業が本格参入し、動画生成AI市場の競争が激化しています。
  • 動画生成AIは、クリエイターの仕事を奪うのではなく、業務効率化や創造の幅を広げるポジティブな変化をもたらす可能性が高いです。

配信元情報

番組名:耳で学ぶAIロボシンク
タイトル:OpenAIが動画生成AIのSoraを発表!ついに真打登場か??
配信日:2024-02-20

タイトルとURLをコピーしました