xAI 几天前推出了 Grok-3 AI 聊天机器人,但将其锁定为每月 40 美元的付费墙。现在,该公司提供免费访问它,但仅限时间有限。 xAI 负责人埃隆·马斯克 (Elon Musk) 表示,免费访问只会在“短时间内”提供,因此任何人都猜测这个窗口会持续多久。
目前,唯一可以使用的两个功能是 Think 和 DeepSearch。 Think是为Grok-3交互添加推理能力的功能,与DeepSeek上的DeepThink 、 Google的Gemini 2.0 Flash Thinking Experimental 、以及OpenAI的o系列模型相同。
思维和推理模型显示了他们如何分解并最终处理用户查询的思路。据专家称,其结果是在解决科学、编码和数学问题等任务上表现更好。
在短时间内,Grok 3 向所有人免费开放! https://t.co/r5iLXi2pBm
—埃隆·马斯克 (@elonmusk) 2025 年 2 月 20 日
另一方面,DeepSearch 相当于 xAI 的深度研究工具,现已可供 Perplexity 、Gemini 和 ChatGPT 用户使用。 Grok-3 只是第二个主流人工智能产品,可免费访问 DeepSearch 或 Deep Research 等计算密集型流程。
这是人工智能模型最有前途的代理用例之一,因为它将知识收集过程提升到了一个全新的水平。一旦用户提出他们的问题,问题就会被分解并提出研究计划,包括必须从哪些来源提取答案的详细信息。
人工智能会遍历所有相关的知识库,通过实时编译的数据进行推理,并以综合报告的形式呈现。

如果您想在移动平台上访问 Grok-3,请转到 X 应用程序并点击底部栏中的 Grok 图标。在网络上,可以通过社交媒体平台访问x.com/i/grok页面直接访问。
所有的炒作都有实质内容
在我使用 DeepSearch 的短暂时间里,我发现它给我留下了深刻的印象。与 Gemini Deep Research 不同的是,它不要求研究方法的批准,并且在您提交问题后直接开始任务。与Gemini相比,它的速度也更快。
关于屏幕时间对青少年思维影响的科学研究现状的深入研究询问,Grok-3 比 Gemini 更快地提供了报告。而且,它更加透明,因为你可以看到收集和寻找答案背后的详细思考过程。

此外,您可以看到整个过程的全阶段细分,实时进展并保存为自己的数据集,位于实际答案之上。另一方面,在代理搜索开始之前您无法编辑研究计划。
另一方面,双子座则采取更加不透明的方式。你可以编辑研究计划,但你看不到流程分解或思维推理流程。就质量而言,Gemini 参考了 37 个网站的材料,并将它们全部作为引用的脚注提供。 Grok-3 的 DeepSearch 仅列出了六个关键引文,尽管它提供的答案同样有用。
当我尝试不太密集的 Think 搜索时,Grok-3 再次被证明是两者中更快的。我询问了微软新型量子计算芯片的相关性,并注意到两个关键的区别。

Grok-3 采用更全面的方法来回答这个问题,不仅关注科学应用和好处,而且在其自己的奉献部分中也关注随之而来的风险。另一个区别是你可以在任何给定时间看到推理链。
Gemini 2.0 Flash Thinking Experimental 再次是不透明的,尽管它的细分细分更加全面。另一个重要的区别是 Gemini 的答案显得更加克制和学术倾向,而 Grok-3 在解释复杂术语时采取了更加自由主义的方法。
很难说哪个 AI 模型更胜一筹,但根据 xAI 共享的基准测试,Grok-3 在多个评估图表上都超越了 Google、OpenAI、DeepSeek 和 Anthropic 的 AI 模型。