Anthropic 的新克劳德模型提供了实时和深思熟虑的响应

克劳德代码主屏幕
人择

OpenAI 的 o3 和 DeepSeek 的 R1 模型出现了一些新的竞争。 Anthropic 周一宣布发布其新的“混合推理”模型 Claude 3.7 Sonnet。

o3R1和 Google 的Gemini 2.0 Flash Thinking等现有推理模型旨在将复杂的问题分解为更小的任务,然后在响应之前推断并验证其答案,这一过程会以更高的计算使用率和更长的推理时间为代价返回更准确的答案。另一方面,根据该公司的公告,Claude 3.7 Sonnet 能够提供“近乎即时的响应或用户可见的扩展的、逐步的思考”。

Claude 3.7 的双重性是该公司简化用户体验并消除其他聊天机器人平台上的大量模型选择器菜单的努力的一部分。 OpenAI 宣布了类似的计划,即将推出 GPT-4.5 和GPT-5 模型

该公司写道:“正如人类使用单个大脑进行快速反应和深度思考一样,我们认为推理应该是前沿模型的集成能力,而不是完全独立的模型。” “这种统一的方法还为用户创造了更加无缝的体验。”

Claude 3.7 Sonnet 正在向所有 Claude 用户推出,但是,该模型的扩展思维能力只有通过付费订阅才能获得。 Anthropic 很快指出,即使采用标准思维流程,Claude 3.7 的表现也优于该模型的前身 Claude 3.5。

新 Sonnet 的扩展思维过程已被证明可以提高模型在各种数学、物理、指令遵循和编码任务中的响应质量。该公司夸口道:“Claude 再次成为现实世界编码任务中的佼佼者,从处理复杂代码库到高级工具使用等领域都有显着改进。”

Anthropic 在周一的声明中还透露了其代理人工智能,称为 Claude Code。该公司写道:“Claude Code 是一位积极的合作者,可以搜索和读取代码、编辑文件、编写和运行测试、提交代码并将其推送到 GitHub,以及使用命令行工具。”

Anthropic 正在发布 Claude Code 作为有限的研究预览版,并计划在未来几周内根据开发人员和其他早期采用者的反馈进一步提高其性能。代理人工智能建立在 Anthropic 早期伪代理 Claude Computer Use成功的基础上,该伪代理使人工智能能够通过模仿人类用户的键盘和鼠标移动来操纵其本地计算系统。


Posted

in

by

Tags: