尽管 Anthropic 的 Claude 可能不像谷歌、微软和 OpenAI 的竞争对手那样占据如此多的头条新闻,但它的实力并不比其前沿模型同行逊色。
事实上,最新版本 Claude 3.5 Sonnet 已在多项行业基准测试中证明与 Gemini 和 ChatGPT 不相上下。在本指南中,您将了解 Claude 是什么、它最擅长做什么,以及如何充分利用这个安静的聊天机器人。
克劳德是什么?
与 Gemini、Copilot 和 ChatGPT 一样,Claude 是一个大型语言模型 (LLM),它依靠算法根据其庞大的训练材料语料库来预测句子中的下一个单词。
Claude 与其他模型的不同之处在于,它经过训练和调节,遵守 73 点“宪法人工智能”框架,旨在使人工智能的反应既有益又无害。克劳德首先通过监督学习方法进行训练,其中模型将生成对给定提示的响应,然后评估该响应与其“构成”的符合程度,最后修改其后续响应。然后,Anthropic 不再依赖人类进行强化学习阶段,而是使用人工智能评估数据集来训练偏好模型,帮助微调 Claude,使其始终输出符合其构成原则的响应。
Anthropic 于 2023 年 3 月发布了 Claude 的第一个迭代,并在四个月后的 2023 年 7 月快速更新为 Claude 2。这些早期版本的编码、数学和推理能力相当有限。随着 2024 年 3 月 Claude 3.0 系列(Haiku、Sonnet 和 Opus)的发布,这种情况发生了变化。Opus 是三个模型中最大的一个,轻松击败了 GPT-3.5、GPT-4 和 Gemini 1.0(所有这些模型都是当时的技术水平)。
“对于绝大多数工作负载,Sonnet 的速度比 Claude 2 和 Claude 2.1 快 2 倍,且智能水平更高,”Anthropic 在Claude 3 公告帖子中写道。 “它擅长执行需要快速响应的任务,例如知识检索或销售自动化。”
Opus 的领先地位将是短暂的。 2024 年 6 月,Anthropic 首次推出了 Claude 3.5,这是一个更强大的模型。 Anthropic 当时写道,Claude 3.5 Sonnet“运行速度是 Claude 3 Opus 的两倍”,使其成为“复杂任务的理想选择,例如上下文相关的客户支持和编排多步骤工作流程”。它的性能总体上也优于 GPT-4o、Gemini 1.5 和 Meta 的 Llama-400B 模型。
10 月, Anthropic 发布了 3.5 Sonnet 的略微改进版本,称为 Claude 3.5 Sonnet(新),同时发布了新的 Claude 3.5 Haiku 模型。 Haiku 是该模型的更小、更轻量的版本,旨在更有效地执行简单和重复的任务。除了网络和移动应用程序之外,Claude 还提供适用于 Mac 和 Windows 的桌面应用程序。
克劳德能做什么?
虽然 ChatGPT 和 Gemini 的设计目的是能够通过语音交互回答广泛主题的问题,但 Claude 却擅长编码、数学和复杂的推理任务。 Anthropic 将最新版本的克劳德称为“迄今为止最强的视觉模型”。据称 3.5 Sonnet 可以执行各种基于视觉的任务,例如从模糊照片中解读文本或解释图表和其他视觉效果。
Claude 也是第一个在聊天对话本身之外提供专用协作空间的法学硕士聊天机器人。 Artifacts 功能于 2024 年 9 月首次推出,充当实时预览窗口,允许用户创建“一个动态工作区,他们可以在其中实时查看、编辑和构建 Claude 的创作,将人工智能生成的内容无缝集成到他们的项目和工作流程,”Anthropic 团队声称。 OpenAI此后为其聊天机器人引入了类似的功能,但目前仅适用于 Plus 和 Enterprise 订阅者。
Claude 还可以通过“ 计算机使用”API 模拟人类用户的击键、鼠标移动和光标单击,从而直接与其他桌面应用程序交互。 “我们训练克劳德观察屏幕上发生的事情,然后使用可用的软件工具来执行任务,”Anthropic 在一篇博客文章中写道。 “当开发人员要求克劳德使用一款计算机软件并为其提供必要的访问权限时,克劳德会查看用户可见内容的屏幕截图,然后计算移动光标需要垂直或水平多少像素才能单击正确的地方。”
如何注册克劳德
您可以通过 Anthropic 网站以及 Claude Android和iOS应用程序亲自试用 Claude。它可以免费使用,支持图像和文档上传,并提供对 Claude 3.5 Sonnet(新)模型的访问。该公司还 提供每月 20 美元的 Pro 计划,该计划授予更高的使用限制、访问 Claude 3 Opus 和 Haiku 的权限,以及项目功能,可在一组特定的文档或文件上微调 AI。要注册,请在左侧导航窗格中单击您的用户名,然后选择升级计划。
克劳德与竞争对手相比如何
Claude 3.5 Sonnet与其主要竞争对手 ChatGPT 相比拥有许多优势。例如,Claude 为用户提供了一个更大的上下文窗口(200,000 个字符与 128,000 个字符),使用户能够制作更细致的提示。克劳德的宪法人工智能架构意味着它经过调整可以提供准确的答案,而不是创造性的答案。该聊天机器人还可以有效地总结研究论文,根据上传的数据生成报告,并将复杂的数学和科学问题分解为易于遵循的分步说明。
虽然它可能很难为你写一首诗,但它擅长生成可验证和可重复的响应,尤其是使用其新引入的分析工具。该公司将其描述为“内置代码沙箱,克劳德可以在其中进行复杂的数学计算、分析数据并在分享答案之前迭代不同的想法。” “处理信息和运行代码的能力意味着您可以获得更准确的答案。”
另一方面,其他聊天机器人可以做很多克劳德做不到的事情。例如,Claude 没有提供与 OpenAI 的高级语音模式相当的功能,因此您必须坚持使用文本和图像提示。 AI 也无法生成图像,就像 ChatGPT 对 Dall-E 3 所做的那样。
克劳德的争议
克劳德的成长过程中也充满了自己造成的戏剧性事件。 Proof News 7 月份的一份报告可信地指责 Anthropic(以及 Nvidia、Apple 和 Salesforce)使用从 48,000 多个频道(包括 MrBeast、Marquees Brownlee 和 Pew Die Pie)中抓取的 173,536 个 YouTube 视频字幕数据集来训练他们的大语言模型。
人工智能聊天机器人最近发布的计算机使用功能也遇到了一些问题。事实证明,Claude 对指令的理解有点过于字面意思,导致 AI 容易受到即时注入攻击,X 用户Johann Rehberger在 10 月份的演示中就证明了这一点。