ChatGPT 推出具有长达 20 秒人工智能视频生成功能的 Sora

自 2 月份以来，OpenAI 一直承诺发布其下一代视频生成器模型 Sora。周一，该公司最终在“12 Days of OpenAI”活动中放弃了它的工作版本。

“这是我们 AGI 路线图的关键部分，”OpenAI 首席执行官 Sam Altman 在公司的直播中表示。

据 OpenAI 团队称，Sora 将从周一下午开始向美国和世界各地的 Plus 和Pro 订阅者提供。

据报道，YouTuber Marquis Brownlee 抢先使用了该视频生成器，并于周一早上在他的频道上发布了简短的评论。 Sora 似乎并不是像 OpenAI 的几乎所有其他生成工具一样构建在GPT-4之上。该模型无法通过标准 ChatGPT 网站获得，而是通过 Sora.com（截至本文发布时尚未上线）。

该模型能够根据文本提示或参考图像生成分辨率从 480p 到 1080p 不等、长度从 5 到 20 秒的视频。它还能够编辑和扩展现有的视频剪辑。 ChatGPT Plus 订阅者每月最多可以生成 50 个高达 720p 的剪辑，以及更少的更高分辨率的视频，每段长度为 5 秒。专业用户可以在所有分辨率下无限生成，持续时间长达 20 秒。除了编辑工具之外，Sora 还提供“故事板”功能，使创作者能够将多个提示组合到一个电影场景中。

Brownlee 指出，该模型需要“几分钟”才能生成 1080p 剪辑，但他指出“这也是，就像现在，几乎没有其他人在使用它一样。我有点想知道当它开放给任何人使用时还需要多长时间。” Brownlee 还指出，该模型在正确生成腿部及其运动方面存在很大困难，前腿和后腿以不自然且难以理解的方式交换位置。

我们送给您的节日礼物：Sora 来了。 https://t.co/JQKGgLAy6E pic.twitter.com/0c0DLl6Udf
— OpenAI (@OpenAI) 2024 年 12 月 9 日

与Grok 2不同，Sora 将限制用户可以创作的内容，并明确禁止生成受版权保护的主题、18 岁以下的人以及任何包含暴力或“露骨主题”的内容。

尽管OpenAI在人工智能行业中处于领先地位，但Sora在整个开发过程中一直受到延迟的困扰，使得Runway的Gen-3 alpha 、快手科技的Kling和Meta的Movie Gen模型等竞争对手在市场上击败了它。 Sora 最近也被一群 Beta 测试人员公开泄露（尽管时间很短），他们指责该公司对该模型的功能进行了“艺术清洗” 。

Posted

9 12 月, 2024

blog

技術新聞普遍器

Tags: