根据The Information的一份新报告,OpenAI 的下一代 Orion 模型ChatGPT有传言称或否认将在今年年底上市,但一旦上市,它可能并不像人们所宣传的那样。
该报告援引匿名 OpenAI 员工的话称,Orion 模型相对于其前身 GPT-4 的改进“远小于GPT-4 相对于 GPT-3 的改进”。这些消息来源还指出,Orion“在处理某些任务(特别是编码应用程序)方面并不比其前身 [GPT-4] 可靠地更好”,尽管新模型在一般语言功能(例如总结文档或生成电子邮件)方面明显更强。
《The Information》的报告指出,用于训练新模型的“高质量文本和其他数据的供应不断减少”是新模型收益微不足道的一个主要因素。简而言之,人工智能行业正在迅速陷入训练数据瓶颈,因为已经从X、Facebook 和 YouTube等网站(后者在两个不同的场合)等网站剥离了社交媒体数据的简单来源。因此,这些公司越来越多地难以找到各种棘手的编码挑战,这些挑战将有助于将他们的模型提升到超出当前能力的水平,从而减慢他们的预发布培训速度。
训练效率的降低具有巨大的生态和商业影响。随着前沿级法学硕士的发展并进一步将其参数数量推向数万亿,能源、水和其他资源的数量预计在未来十年将增加六倍。这就是为什么我们看到微软试图重启三哩岛、 AWS 购买一座 960 兆瓦的工厂、谷歌购买七个核反应堆的输出,所有这些都是为了为其不断增长的人工智能数据中心提供必要的电力——美国目前的数据中心电力基础设施根本跟不上。
据 TechCrunch 报道,作为回应,OpenAI 创建了一个“基础团队”,以避免缺乏适当的训练数据。这些技术可能涉及使用合成训练数据,例如Nvidia 的 Nemotron 系列模型可以生成的数据。该团队还在研究提高模型训练后的性能。
Orion 最初被认为是 OpenAI 的GPT-5的代号,现在预计将在 2025 年的某个时候到来。我们是否有足够的可用电力来看到它的运行,而不会使我们的市政电网停电,还有待观察。