ChatGPT 的最新更新有些奇怪

OpenAI 宣布已实施新版本的GPT-4o大语言模型来驱动其ChatGPT 聊天机器人,但拒绝具体说明更新后的模型与其前身有何不同。

“需要明确的是,这是对 GPT-4o 的改进,而不是新的前沿模型,”该公司周一在 X(前身为 Twitter)上发帖称。

“我们推出了 GPT-4o 的更新,通过实验结果和定性反馈,我们发现 ChatGPT 用户往往更喜欢该更新,”该公司在其模型发行说明中写道。 “这不是一个新的前沿级模型。尽管我们想确切地告诉您模型响应有何不同,但弄清楚如何精细地进行基准测试和传达模型行为改进本身就是一个持续的研究领域(我们正在努力!)。”

由于公司没有提供具体细节,毫不奇怪,许多用户开始猜测这些变化的性质以及它们是否代表新功能。 X 用户@misaligned_agi在社交媒体上大胆表示,新的更新实施了多步推理方法,而不是全新的模型。

OpenAI 很快就打消了这种思路, 发言人告诉 VentureBeat ,这实际上并不是一个新的推理过程,@misaligned_agi 观察到的行为可能是由他们的提示结构触发的。

其他用户也在社交媒体上表达了他们的理论,认为 GPT-4o 最近开始以微妙的不同和更好的方式表现,并且其图像生成质量有所提高。 “很长一段时间以来,它第一次在输出上提供了比 3.5 Sonnet 更好的‘共鸣’,”X 用户@mattshumer_观察到。

在允许用户对定义新迭代(OpenAI 称之为 ChatGPT-4o-latest)进行最佳猜测后,该公司周三在其模型页面添加了一些少量的细节

GPT-4o-latest 被描述为“在 ChatGPT 中不断更新到当前版本的 GPT-4o 的动态模型”,其知识截止日期为 2023 年 10 月,每个对话可容纳 128,000 个令牌,即 96,000 个单词,就像之前的版本一样GPT-40 版本做到了。它可以输出 16,384 个标记,或 12,288 个单词,与较新的 GPT-40-mini 模型相当,大约是较旧的 GPT-4o 的四倍。

不幸的是,像这样的硬统计数据并不能深入了解新模型的实际能力,而且显然它的开发人员也不会。


Posted

in

by

Tags: