OpenAI 刚刚摆脱了免费版 ChatGPT 的束缚

OpenAI 宣布发布其最新的零食大小的生成模型，称为 GPT-4o mini，与标准GPT-4o 模型相比，该模型资源密集程度较低且运行成本较低，使开发人员能够将 AI 技术集成到更广泛的领域中。产品。

对于开发人员和应用程序来说，这是一次重大升级，但它也扩展了 ChatGPT 免费版本的功能并减少了限制。从今天开始，GPT-4o mini 现已通过 ChatGPT 网络和应用程序向用户和开发人员提供免费、Plus 和团队级别的用户使用，而 ChatGPT Enterprise 订阅者将于下周获得访问权限。从今天开始，GPT-4o mini 将取代该公司现有的小型型号 GPT-3.5 Turbo，供最终用户使用。

如果开发人员暂时不想切换到 4o mini，他们仍然可以通过 API 使用旧型号。该公司表示最终将淘汰旧型号，但尚未确定日期。

自 5 月份以来，GPT-4o 已可供免费 ChatGPT 帐户使用，但需求方面存在限制。根据更新的常见问题解答页面，GPT-4o 本身仍然存在这些限制，但当您达到限制时，您现在将降级到 GPT-4o mini，而不是 GPT-3.5。从理论上讲，这对于那些尚未升级到ChatGPT Plus 的人来说是一个巨大的胜利。

随着 GPT-4o mini 的推出，我们将继续让所有人都能使用先进的人工智能，GPT-4o mini 现已在 API 中提供，并于今天在 ChatGPT 中推出。 https://t.co/sTxtOfUapJ
— OpenAI (@OpenAI) 2024 年 7 月 18 日

根据Artificial Analysis的数据，OpenAI最新的AI模型在MMLU推理基准测试中得分为82%，比Gemini 1.5 Flash高出3%，比Claude 3 Haiku高出7%。作为参考，迄今为止最高的 MMLU 基准是由Google 顶级 AI Gemini Ultra 设定的，得分为 90% 。

更重要的是，OpenAI 声称 GPT-4o mini 的运行成本比 GPT-3.5 Turbo 便宜 60%。开发者将为每百万个输入代币支付 15 美分，为每百万个输出代币支付 60 美分。据CNBC 报道，OpenAI 表示，GPT-4o mini 是“当今功能最强大、最具成本效益的小型型号”。

这些节省的成本从何而来？好吧，并不是每项可以通过 AI 增强的任务都需要像GPT 、 Claude或Gemini这样的全尺寸模型的全部权重和功能。就像用大锤打苍蝇一样，使用标准大小的 LLM 来完成简单但大批量的任务是过度杀伤力，浪费金钱和计算资源 – 这就是 Google 的 Gemini 1.5 Flash、Meta 的 Llama 3 8b 或 Anthropic 的 Claude 3 等小型 LLM 的用武之地。 Haiku 出现了。与较大的迭代相比，他们能够更快、更经济地执行这些简单的重复性任务。

据 OpenAI 称，GPT-4o mini 将具有与 2023 年 10 月的全尺寸版本相同大小的上下文窗口、128,000 个代币（大约相当于一本书的内容），也具有相同的知识截止时间，尽管该公司没有具体说明新型号的确切尺寸。模型 API 目前仅提供文本和视觉功能，但未来也会提供视频和音频功能。

就在该公告发布几周前，OpenAI 作为 GPT-4o 的一部分，对其预期的高级语音模式进行了期待已久的更新。该公司的最新消息表明，较小的 alpha 版本仍将于 7 月下旬发布，并于今年秋季进行更广泛的发布。