我们都预见到了它的到来,这一天终于来了——ChatGPT正在慢慢地变成你友好的邻里人工智能,如果你说一些有趣的话,它会和你一起开怀大笑,或者如果你表现得很好,就会发出“哇”的声音——这只是今天公告的冰山一角。 OpenAI刚刚举办了一场特别的春季更新活动,期间它推出了最新的大语言模型(LLM)——GPT-4o。通过此更新,ChatGPT 获得了桌面应用程序,将会更好更快,但最重要的是,它变得完全多模式。
活动以 OpenAI 首席技术官 Mira Murati 的介绍开始,她透露今天的更新不仅仅针对付费用户 – GPT-4o 正在为免费用户和付费订阅者跨平台推出。 “GPT-4o 的特别之处在于,它为每个人带来了 GPT-4 级别的智能,包括我们的免费用户,”Murati 说。
据说 GPT-4o 速度要快得多,但令人印象深刻的是,它确实将文本、视觉和音频方面的功能提升了几个档次。开发人员还可以使用它集成到他们的 API 中,据说速度提高了两倍,成本降低了 50%,速率限制比 GPT-4 Turbo 高出五倍。
除了新模型之外,OpenAI 还推出了 ChatGPT 桌面应用程序以及网站上用户界面的刷新。目标是使聊天机器人尽可能易于沟通。 “我们正在研究我们自己与机器之间交互的未来,我们认为 GPT-4o 确实正在将这种范式转变为协作的未来 – 交互变得更加自然,”Murati 说。
为此,Murati 在 OpenAI 的 Mark Chen 和 Barret Zoph 的帮助下展示的新改进确实确实使交互变得更加无缝。 GPT-4o 现在能够实时分析视频、图像和语音,并且可以准确地定位这三者中的情绪。这在 ChatGPT Voice 中尤其令人印象深刻,它变得非常像人类,以至于它绕过了恐怖谷的边缘。
对 ChatGPT 说“嗨”会引起热情、友好的反应,其中带有一丝机器人的底气。当马克·陈(Mark Chen)告诉人工智能他正在进行现场演示并需要帮助平静下来时,人工智能听起来印象深刻,并立即提出他应该深呼吸几次的想法。它还注意到呼吸太快的时候——实际上更像是喘气——并引导陈找到正确的呼吸方式,首先开了一个小玩笑:“你不是吸尘器。”
对话自然进行,因为您现在可以中断 ChatGPT,而不必等待它完成,并且响应很快,没有尴尬的停顿。当被要求讲睡前故事时,它会根据语气做出回应,从热情到戏剧化,再到机械化。演示的后半部分展示了 ChatGPT 准确阅读代码、通过视频帮助解决数学问题以及阅读和描述屏幕内容的能力。
该演示并不完美——机器人有时会断线,很难判断这是由于其他人在说话还是由于延迟。然而,它听起来就像聊天机器人一样栩栩如生,它读取人类情感并做出相应反应的能力既令人兴奋又令人焦虑。听到 ChatGPT 的笑声并不在我本周会听到的事情清单上,但我们来了。
具有多模式设计的 GPT-4o 以及桌面应用程序将在未来几周内逐步推出。几个月前, Bing Chat 告诉我们,它想要成为人类,但现在,我们即将获得 ChatGPT 的一个版本,它可能是自人工智能热潮开始以来我们所见过的最接近人类的版本。