OpenAI 刚刚摆脱了免费版 ChatGPT 的束缚

OpenAI 宣布发布其最新的零食大小的生成模型,称为 GPT-4o mini,与标准GPT-4o 模型相比,该模型资源密集程度较低且运行成本较低,使开发人员能够将 AI 技术集成到更广泛的领域中。产品。

对于开发人员和应用程序来说,这是一次重大升级,但它也扩展了 ChatGPT 免费版本的功能并减少了限制。从今天开始,GPT-4o mini 现已通过 ChatGPT 网络和应用程序向用户和开发人员提供免费、Plus 和团队级别的用户使用,而 ChatGPT Enterprise 订阅者将于下周获得访问权限。从今天开始,GPT-4o mini 将取代该公司现有的小型型号 GPT-3.5 Turbo,供最终用户使用。

如果开发人员暂时不想切换到 4o mini,他们仍然可以通过 API 使用旧型号。该公司表示最终将淘汰旧型号,但尚未确定日期。

自 5 月份以来,GPT-4o 已可供免费 ChatGPT 帐户使用,但需求方面存在限制。根据更新的常见问题解答页面,GPT-4o 本身仍然存在这些限制,但当您达到限制时,您现在将降级到 GPT-4o mini,而不是 GPT-3.5。从理论上讲,这对于那些尚未升级到ChatGPT Plus 的人来说是一个巨大的胜利。

根据Artificial Analysis的数据,OpenAI最新的AI模型在MMLU推理基准测试中得分为82%,比Gemini 1.5 Flash高出3%,比Claude 3 Haiku高出7%。作为参考,迄今为止最高的 MMLU 基准是由Google 顶级 AI Gemini Ultra 设定的,得分为 90%

更重要的是,OpenAI 声称 GPT-4o mini 的运行成本比 GPT-3.5 Turbo 便宜 60%。开发者将为每百万个输入代币支付 15 美分,为每百万个输出代币支付 60 美分。据CNBC 报道,OpenAI 表示,GPT-4o mini 是“当今功能最强大、最具成本效益的小型型号”。

这些节省的成本从何而来?好吧,并不是每项可以通过 AI 增强的任务都需要像GPTClaudeGemini这样的全尺寸模型的全部权重和功能。就像用大锤打苍蝇一样,使用标准大小的 LLM 来完成简单但大批量的任务是过度杀伤力,浪费金钱和计算资源 – 这就是 Google 的 Gemini 1.5 Flash、Meta 的 Llama 3 8b 或 Anthropic 的 Claude 3 等小型 LLM 的用武之地。 Haiku 出现了。与较大的迭代相比,他们能够更快、更经济地执行这些简单的重复性任务。

据 OpenAI 称,GPT-4o mini 将具有与 2023 年 10 月的全尺寸版本相同大小的上下文窗口、128,000 个代币(大约相当于一本书的内容),也具有相同的知识截止时间,尽管该公司没有具体说明新型号的确切尺寸。模型 API 目前仅提供文本和视觉功能,但未来也会提供视频和音频功能。

就在该公告发布几周前,OpenAI 作为 GPT-4o 的一部分,对其预期的高级语音模式 进行了期待已久的更新。该公司的最新消息表明,较小的 alpha 版本仍将于 7 月下旬发布,并于今年秋季进行更广泛的发布。


Posted

in

by

Tags: