事实证明,以更少的成本完成 OpenAI 所做的事情并不难

OpenAI 的新字体 OpenAI Sans
开放人工智能

尽管 OpenAI 继续坚称实现AGI 的唯一途径在于大量的财务和能源支出,但独立研究人员正在利用开源技术来匹配其最强大模型的性能,而且价格仅为其一小部分。

上周五,来自斯坦福大学和华盛顿大学的一个联合团队宣布,他们已经训练了一个以数学和编码为重点的大型语言模型,其性能与OpenAI 的 o1DeepSeek 的 R1推理模型一样好。构建它只需 50 美元的云计算积分。据报道,该团队使用了现成的基础模型,然后将 Google 的Gemini 2.0 Flash Thinking Experimental模型提炼到其中。提炼人工智能的过程包括从较大的人工智能模型中提取相关信息来完成特定任务,并将其转移到较小的模型中。

更重要的是,周二,Hugging Face 的研究人员发布了OpenAI 深度研究谷歌 Gemini 深度研究工具的竞争对手,称为Open Deep Research ,他们在短短 24 小时内开发了该工具。 Hugging Face在其公告中写道:“虽然强大的法学硕士现在可以免费开源,但 OpenAI 并没有透露太多有关深度研究背后的代理框架的信息。” “因此,我们决定开始一项 24 小时的任务,重现他们的结果,并在此过程中开源所需的框架!”据报道,它的云计算积分成本估计为 20 美元,并且训练时间不到 30 分钟。

Hugging Face 的模型随后在通用人工智能助手 (GAIA) 基准测试中获得了 55% 的准确率,该基准测试用于测试代理人工智能系统的能力。相比之下,OpenAI 的 Deep Research 的准确率介于 67% 至 73% 之间,具体取决于响应方法。诚然,24 小时模型的性能不如 OpenAI 的产品,但它也不需要花费数十亿美元和一个欧洲中等国家的能源发电能力来训练。

此前,一月份有消息称,加州大学伯克利分校 Sky 计算实验室的一个团队成功训练了他们的 Sky T1 推理模型,并获得了约 450 美元的云计算积分。该团队的 Sky-T1-32B-Preview 模型证明与早期发布的 o1-preview 推理模型相当。随着越来越多的开源竞争对手出现,挑战 OpenAI 的行业主导地位,它们的存在本身就让人质疑该公司斥资 5 万亿美元建设人工智能数据中心和能源生产设施的计划是否真的是答案。


Posted

in

by

Tags: