以下是 Claude 3.5 Sonnet 和 GPT-4o 的直接比较

在不断发展的大型语言模型 (LLM) 领域,有两个领先者在竞争中脱颖而出:Anthropic 的Claude 3.5 Sonnet和 OpenAI 的GPT-4o (“o”代表“Omni”)。这两种人工智能都拥有令人印象深刻的能力,但哪一个占据主导地位呢?本指南深入研究 Claude 3.5 Sonnet 和 GPT-4o,剖析它们在各种任务中的优点和缺点。

我们不仅将探索它们的相对准确性和响应速度,还将揭示它们的定价结构和服务等级。读完本文后,您将掌握相关知识,以便就哪种法学硕士最适合您的特定需求和预算做出明智的决定。

定价和等级

ChatGPT 用户可以免费访问 GPT-4o 模型,但在三小时内允许提出的查询数量是有限的。超过该限制将使您转而使用 GPT-3.5(OpenAI 较旧的、功能较弱的模型),直到冷却计时器重置。

如果用户想随心所欲地使用 GPT-4o,则需要支付每月 20 美元的ChatGPT Plus 订阅、每月 30 美元的 Teams 订阅或市场价格的 Enterprise 子订阅。付费访问不仅大大提高了使用 AI 模型的速率上限,而且还允许访问 Dall-E 图像生成等附加功能。

克劳德定价等级的屏幕截图
人择

对 Claude 的访问设置方式大致相同。在免费套餐中,用户可以通过网络或 iOS 应用程序与聊天机器人交谈。他们还可以将图像和文档上传到 Anthropic 服务器,并向 AI 查询其内容,并享受新的 Claude 3.5 Sonnet 模型的有限使用。

每月支付 20 美元购买 Pro 帐户即可获得免费套餐的一切,以及更高的使用限制、访问 Claude 3 Opus 和 Haiku、优先带宽和可用性,以及使用以集合为中心的 AI 创建项目的能力文档或文件。每人(至少 5 人)每月支付 30 美元购买 Teams 帐户,可以获得更高的使用限制,并能够在队友之间共享聊天。

使用克劳德的优点

虽然 Claude 可能无法享有与 GPT-4o 相同程度的知名度,但 Anthropic 的最新 AI 模型比其竞争对手拥有许多优势,而不仅仅是在性能基准方面。其一,Claude 拥有比 ChatGPT 大得多的上下文窗口(200,000 个字符对 128,000 个字符)。

这意味着它可以记住和分析之前的大部分对话或文本,从而产生更细致和相关的响应,尤其是在较长的交互中。克劳德还接受过训练,在回答中优先考虑准确性而不是创造力。

它在生成有趣的俳句方面可能有点困难,但克劳德擅长总结研究论文并根据上传的数据生成报告。 Claude 的知识截止日期也比 GPT-4o 更近:2024 年 4 月与 2023 年 10 月。

Claude 3.5 十四行诗与 Artifacts 侧屏的屏幕截图
人择

此外,Anthropic 将其 Claude 模型训练为宪法人工智能。这意味着系统实施一套原则来对其生成的输出进行判断,有效地引导模型走向宪法规定的道德行为。这包括避免有毒或歧视性的产出,以及避免描述或倡导非法或不道德的活动。

使用 GPT-4o 的优点

另一方面,GPT-4o 为用户提供了比 Claude 更广泛的功能、更大的知识库和更灵活的登录选项。

与 Anthropic 的产品不同,ChatGPT 可以生成图像(尽管该功能需要订阅)并访问网络以查找可用的最新信息,而不仅仅是其训练数据。与 Claude 的注册过程相反,GPT-4o 用户无需提供电话号码进行验证,或者根本不需要提供任何凭据,即可开始使用该模型并且由于其更大的知识库, GPT-4o 比 Claude 更擅长跨图像、文本和音频生成创意内容。

ChatGPT 网站的用户请求过载率也远低于 Claude 网站。

速度和准确度比较

这两种模型都能够生成各种文本输出,从改进用户编写的散文到创建计算机代码和电子表格算法。当被要求生成“一段用于测量圆面积并生成函数图的 Python 代码”时,两者都返回了类似结构的片段。 GPT-4o 产生以下内容:

将 numpy 导入为 np
将 matplotlib.pyplot 导入为 plt

# 计算圆面积的函数
def 计算面积(半径):
返回 np.pi * 半径 ** 2

# 生成一系列半径值
radii = np.linspace(0, 10, 100) # 半径从 0 到 10,有 100 个点

# 计算对应的面积值
面积 = 计算面积(半径)

# 绘制函数图
plt.figure(figsize=(10, 6))
plt.plot(半径,面积,标签='面积= πr²')
plt.title('圆的面积作为半径的函数')
plt.xlabel('半径')
plt.ylabel('区域')
plt.图例()
plt.网格(真)
plt.show()

与此同时,克劳德的回应​​更加具体:

导入数学
将 numpy 导入为 np
将 matplotlib.pyplot 导入为 plt

def 圆区域(半径):
返回 math.pi * 半径**2

# 生成 0 到 10 之间的半径,共 100 个点
半径 = np.linspace(0, 10, 100)

# 计算每个半径的面积
Areas = [circle_area(r) for r in radii]

# 创建情节
plt.figure(figsize=(10, 6))
plt.plot(半径,面积,'b-',线宽=2)
plt.title('圆的面积作为半径的函数')
plt.xlabel('半径')
plt.ylabel('区域')
plt.网格(真)

# 添加一些有趣的点
plt.plot(0, 圆面积(0), 'ro', 标签='r = 0′)
plt.plot(1,circle_area(1),'ro',label='r = 1′)
plt.plot(5, Circle_area(5), 'ro', label='r = 5′)
plt.plot(10, 圆面积(10), 'ro', 标签='r = 10′)

plt.图例()
plt.show()

在图像识别方面,两个模型非常匹配。当被要求识别下图的各个方面时,GPT-4o 和 Claude 3.5 都能轻松找到并描述存在的 21 个项目中的每一个。

由 Meta 3D Gen 制作的一系列 3D 生成图像

GPT-4o 的优势在于提供有关最近事件的信息,因为它能够在网络上搜索比其训练数据更新的新闻。问克劳德“昨天卢森堡发生了什么”只会给你一张纸条:“我很抱歉,但我无法获取有关卢森堡昨天发生的具体事件的实时新闻或信息。我的知识截止日期是 2024 年 4 月,我没有该日期之后发生的事件的信息。”人工智能确实提供了许多有用的建议,告诉您在哪里可以找到您所请求的信息。

我确实发现比较这两个系统有点困难,主要是因为我只能向克劳德提出六个请求,然后系统就把我锁在外面三个小时了。即使在 ChatGPT 的免费层上,我也不会完全被系统冻结——我只需要与一个稍差的模型交谈一段时间。

哪个更好?

最终,最佳选择取决于您的具体需求。如果您优先考虑事实准确性、长文档处理并且预算紧张,克劳德可能更适合。

然而,如果您需要更广泛的创意功能并愿意为额外功能付费,ChatGPT 仍然是更好的选择。


Posted

in

by

Tags: