xAI 的 Grok-3 短期免费。我尝试过,印象深刻

xAI 几天前推出了 Grok-3 AI 聊天机器人,但将其锁定为每月 40 美元的付费墙。现在,该公司提供免费访问它,但仅限时间有限。 xAI 负责人埃隆·马斯克 (Elon Musk) 表示,免费访问只会在“短时间内”提供,因此任何人都猜测这个窗口会持续多久。

目前,唯一可以使用的两个功能是 Think 和 DeepSearch。 Think是为Grok-3交互添加推理能力的功能,与DeepSeek上的DeepThinkGoogle的Gemini 2.0 Flash Thinking Experimental 、以及OpenAI的o系列模型相同。

思维和推理模型显示了他们如何分解并最终处理用户查询的思路。据专家称,其结果是在解决科学、编码和数学问题等任务上表现更好。

另一方面,DeepSearch 相当于 xAI 的深度研究工具,现已可供 Perplexity 、Gemini 和 ChatGPT 用户使用。 Grok-3 只是第二个主流人工智能产品,可免费访问 DeepSearch 或 Deep Research 等计算密集型流程。

这是人工智能模型最有前途的代理用例之一,因为它将知识收集过程提升到了一个全新的水平。一旦用户提出他们的问题,问题就会被分解并提出研究计划,包括必须从哪些来源提取答案的详细信息。

人工智能会遍历所有相关的知识库,通过实时编译的数据进行推理,并以综合报告的形式呈现。

移动设备上的 Grok-3 beta 仪表板。
纳迪姆·萨瓦尔 / 数字趋势

如果您想在移动平台上访问 Grok-3,请转到 X 应用程序并点击底部栏中的 Grok 图标。在网络上,可以通过社交媒体平台访问x.com/i/grok页面直接访问。

所有的炒作都有实质内容

在我使用 DeepSearch 的短暂时间里,我发现它给我留下了深刻的印象。与 Gemini Deep Research 不同的是,它不要求研究方法的批准,并且在您提交问题后直接开始任务。与Gemini相比,它的速度也更快。

关于屏幕时间对青少年思维影响的科学研究现状的深入研究询问,Grok-3 比 Gemini 更快地提供了报告。而且,它更加透明,因为你可以看到收集和寻找答案背后的详细思考过程。

从 xAI 的 Grok-3 AI 模型中寻找答案。
纳迪姆·萨瓦尔 / 数字趋势

此外,您可以看到整个过程的全阶段细分,实时进展并保存为自己的数据集,位于实际答案之上。另一方面,在代理搜索开始之前您无法编辑研究计划。

另一方面,双子座则采取更加不透明的方式。你可以编辑研究计划,但你看不到流程分解或思维推理流程。就质量而言,Gemini 参考了 37 个网站的材料,并将它们全部作为引用的脚注提供。 Grok-3 的 DeepSearch 仅列出了六个关键引文,尽管它提供的答案同样有用。

当我尝试不太密集的 Think 搜索时,Grok-3 再次被证明是两者中更快的。我询问了微软新型量子计算芯片的相关性,并注意到两个关键的区别。

比较 Gemini 和 Grok-3 生成的响应
纳迪姆·萨瓦尔 / 数字趋势

Grok-3 采用更全面的方法来回答这个问题,不仅关注科学应用和好处,而且在其自己的奉献部分中也关注随之而来的风险。另一个区别是你可以在任何给定时间看到推理链。

Gemini 2.0 Flash Thinking Experimental 再次是不透明的,尽管它的细分细分更加全面。另一个重要的区别是 Gemini 的答案显得更加克制和学术倾向,而 Grok-3 在解释复杂术语时采取了更加自由主义的方法。

很难说哪个 AI 模型更胜一筹,但根据 xAI 共享的基准测试,Grok-3 在多个评估图表上都超越了 Google、OpenAI、DeepSeek 和 Anthropic 的 AI 模型。


Posted

in

by

Tags: