ChatGPTを運営するOpenAI社「画期的なテキストからビデオへの変換プログラム」を発表

「Sora」は複雑なシーンを生成できるが、最終的なリリースまでには制限される予定

RT
16 Feb, 2024 19:40

ChatGPTを運営するOpenAI社は、テキストプロンプトをコンピューター生成ビデオに変える新しいツールを発表した。このプログラムは、OpenAIがさまざまな検閲機能を組み込んだ後、一般に公開される。

「『Sora』の愛称で呼ばれるこのプログラムは、ユーザーからのプロンプトをもとに、複数のキャラクター、特定の種類の動き、被写体や背景の正確なディテールを持つ複雑なシーンを生成することができる」と、OpenAI社は木曜日にウェブサイトで声明を発表した。

Soraは、ユーザーが投稿した画像に基づいてビデオを作成したり、既存のビデオ映像を新しい素材で拡張したりすることもできる、と同社は述べている。

Xの一連の投稿で、OpenAIは、プロンプトから生成されたものを含む、Soraが作成した複数の動画を共有した: 「美しい雪景色の東京の街は賑やかだ。カメラは賑やかな通りを進み、美しい雪景色を楽しみ、近くの屋台で買い物をする人々を追う。華やかな桜の花びらが、雪の結晶と一緒に風に舞っている。」

[

OpenAIの創設者サム・アルトマンはその後、フォロワーから提案された動画をXに投稿した。「山の頂上でポッドキャスティングをする2匹のゴールデンレトリバー」や、本物そっくりの 「ソーシャルメディアのインフルエンサーであるおばあちゃんが主催する手作りニョッキのクッキングセッション」などだ。

OpenAIは、Soraがいつ一般公開されるかは明言しなかった。同社は、「過激な暴力、性的コンテンツ、憎悪的なイメージ、有名人の肖像、または他人の(知的財産)」のシーンを作成するために使用されないことを確認するために、いわゆる「レッドチーム」に最初に渡されると述べた。

同社はまた、この技術にはまだ不具合やエラーが生じやすいとも指摘している。「複雑なシーンの物理を正確にシミュレートすることに苦労するかもしれないし、原因と結果の特定の例を理解できないかもしれない。例えば、人がクッキーを齧るかもしれないが、その後、クッキーには齧った跡が残らないかもしれない」とOpenAIはサイトで述べている。

OpenAI社のGPT言語モデルは、2022年後半にチャットボット・プログラムに採用された後、わずか4ヵ月後にはSATの読解試験で93%台、SATの数学試験で89%台の成績を収めた。

アルトマンは以前、自身のテクノロジーの可能性に「少し怯えている」と認めている。しかし、顧客がOpenAIを使って「武器の開発や使用、他者への危害や財産の破壊、サービスやシステムのセキュリティを侵害する不正な活動」をすることを禁じているにもかかわらず、OpenAIは1月、いくつかの人工知能プロジェクトで米軍と協力していることを発表した。

OpenAIが米国防総省と提携したのは、同社の技術を「軍事・戦争」目的に使用することを事前に禁止していたのを取り下げたためだと、同社幹部のアンナ・マカンジュ氏はダボスで開催された世界経済フォーラムの年次総会で語った。

www.rt.com