如何亲自尝试 OpenAI 的新 o1-preview 模型

尽管传闻已经开发了数月,但 OpenAI 上周发布的草莓项目还是让人感到意外,许多分析师认为,该模型即使不是在秋季晚些时候,至少也要几周才能准备好。

新的 o1-preview 模型及其 o1-mini 模型已经可供使用和评估,以下是您自己访问的方法。

o1是什么?

OpenAI毫不掩饰其通用人工智能 (AGI) 的抱负,草莓项目(现称为“o1”)是该公司实现这一目标的下一步。根据OpenAI 的公告,这是新系列“推理”模型中的第一个,“旨在在做出反应之前花更多时间思考”。该策略使该模型能够“通过复杂的任务进行推理,并解决比以前的科学、编码和数学模型更难的问题。”

据报道,这些模型以类似人类的方式进行推理,使他们能够在通过训练获得经验时“完善他们的思维过程,尝试不同的策略,并认识到他们的错误”。据 OpenAI 称,o1-preview 的运行效果与 Ph.D. 相当。物理、化学和生物专业的学生,​​并且在这些科目的基准测试中表现相似。 o1 还擅长编码和数学问题,在国际数学奥林匹克 (IMO) 资格考试中得分为 83%,而 GPT-4o 仅得分 13%,并且在与人类对手的 Codeforces 竞赛中达到第 89 个百分点。

o1-mini 是标准 o1-preview 模型的轻量级版本。据报道,它的运行成本比较大的迭代低 80%,这使得它特别适合编码分析和生成任务。

o1-preview 可以试用吗?

是的,o1-preview 模型于 9 月 12 日向ChatGPT Plus和 Teams 订阅者推出。企业和教育用户将在下周初获得访问权限。

o1 针对不良行为者的安全性如何?  

看起来非常。据报道,OpenAI 开发了一个全新的安全培训计划,该计划利用模型增强的推理能力,使其更有效地遵守其安全和对齐准则。该公司指出,在测试中,GPT-4o 在抵抗越狱尝试方面得分为 22 分(满分 100 分),而新的 o1 型号得分为 84 分。

如何访问 o1-preview?

与所有新的生成式人工智能功能一样,新发布的 o1-preview 目前仅向付费订阅者开放。如果您想亲自尝试,则需要选择每月 20 美元的 Plus 订阅。只需单击左侧导航窗格底部的升级计划单选按钮,然后按照屏幕上的提示输入您的付款详细信息。

激活订阅后,从 ChatGPT 主页左侧的模型选择器切换中选择 o1-preview 或 o1-mini。请注意,即使对于付费用户,访问也是有限的,o1-preview 的每周速率限制为 30 条消息,o1-mini 的每周速率限制为 50 条消息。 OpenAI 表示,它最终将为免费用户提供 o1-mini,但该公司尚未确定推出日期。


Posted

in

by

Tags: