自 2 月份以来,OpenAI 一直承诺发布其下一代视频生成器模型 Sora。周一,该公司最终在“12 Days of OpenAI”活动中放弃了它的工作版本。
“这是我们 AGI 路线图的关键部分,”OpenAI 首席执行官 Sam Altman 在公司的直播中表示。
据 OpenAI 团队称,Sora 将从周一下午开始向美国和世界各地的 Plus 和Pro 订阅者提供。
据报道,YouTuber Marquis Brownlee 抢先使用了该视频生成器,并于周一早上在他的频道上发布了简短的评论。 Sora 似乎并不是像 OpenAI 的几乎所有其他生成工具一样构建在GPT-4之上。该模型无法通过标准 ChatGPT 网站获得,而是通过 Sora.com(截至本文发布时尚未上线)。
该模型能够根据文本提示或参考图像生成分辨率从 480p 到 1080p 不等、长度从 5 到 20 秒的视频。它还能够编辑和扩展现有的视频剪辑。 ChatGPT Plus 订阅者每月最多可以生成 50 个高达 720p 的剪辑,以及更少的更高分辨率的视频,每段长度为 5 秒。专业用户可以在所有分辨率下无限生成,持续时间长达 20 秒。除了编辑工具之外,Sora 还提供“故事板”功能,使创作者能够将多个提示组合到一个电影场景中。
Brownlee 指出,该模型需要“几分钟”才能生成 1080p 剪辑,但他指出“这也是,就像现在,几乎没有其他人在使用它一样。我有点想知道当它开放给任何人使用时还需要多长时间。” Brownlee 还指出,该模型在正确生成腿部及其运动方面存在很大困难,前腿和后腿以不自然且难以理解的方式交换位置。
我们送给您的节日礼物:Sora 来了。 https://t.co/JQKGgLAy6E pic.twitter.com/0c0DLl6Udf
— OpenAI (@OpenAI) 2024 年 12 月 9 日
与Grok 2不同,Sora 将限制用户可以创作的内容,并明确禁止生成受版权保护的主题、18 岁以下的人以及任何包含暴力或“露骨主题”的内容。
尽管OpenAI在人工智能行业中处于领先地位,但Sora在整个开发过程中一直受到延迟的困扰,使得Runway的Gen-3 alpha 、 快手科技的Kling和Meta的Movie Gen模型等竞争对手在市场上击败了它。 Sora 最近也被一群 Beta 测试人员公开泄露(尽管时间很短),他们指责该公司对该模型的功能进行了“艺术清洗” 。