GPT-4：您需要了解的有关 ChatGPT 标准 AI 模型的一切

当ChatGPT出现时，人们惊叹不已，对其作为最初由 GPT-3.5 大语言模型支持的人工智能聊天机器人的自然语言能力印象深刻。但当备受期待的 GPT-4 大语言模型问世时，它揭开了我们对人工智能的想象，有人称其为AGI（通用人工智能）的早期雏形。

什么是 GPT-4？

GPT-4是OpenAI创建的最新语言模型，可以生成类似于人类语音的文本。它改进了 ChatGPT 使用的技术，ChatGPT以前基于 GPT-3.5，但后来进行了更新。 GPT 是 Generative Pre-trained Transformer 的缩写，是一种利用人工神经网络像人类一样写作的深度学习技术。

据 OpenAI 称，这种下一代语言模型在三个关键领域比 ChatGPT 更先进：创造力、视觉输入和更长的上下文。在创造力方面，OpenAI 表示 GPT-4 在创建和与用户协作开展创意项目方面要好得多。其中的例子包括音乐、剧本、技术写作，甚至“学习用户的写作风格”。

较长的上下文也会影响这一点。 GPT-4 现在可以处理来自用户的多达 128k 个文本标记。您甚至可以只向 GPT-4 发送一个网络链接，并要求它与该页面的文本进行交互。 OpenAI 表示，这有助于创建长篇内容以及“扩展对话”。

GPT-4 现在还可以接收图像作为交互的基础。在 GPT-4 网站上提供的示例中，聊天机器人获得了一些烘焙原料的图像，并被询问可以用它们制作什么。目前尚不清楚视频是否也可以以同样的方式使用。

GPT-4：您需要了解的有关 ChatGPT 标准 AI 模型的一切 — 图片经版权所有者许可使用

最后，OpenAI 还表示 GPT-4 比上一代使用起来更加安全。据报道，在 OpenAI 自己的内部测试中，它可以产生多 40% 的事实响应，同时“响应禁止内容的请求”的可能性也降低了 82%。

OpenAI 表示，它已经接受了人类反馈的培训，以取得这些进步，并声称已与“50 多名专家合作，在包括人工智能安全和保障在内的领域提供早期反馈”。

在它首次推出后的最初几周内，用户发布了他们用它所做的一些令人惊奇的事情，包括发明新语言、详细说明如何逃离现实世界，以及从头开始为应用程序制作复杂的动画。一名用户显然让GPT-4 使用 HTML 和 JavaScript 的混合在短短 60 秒内创建了 Pong 的工作版本。

如何使用 GPT-4

GPT-4 可供 OpenAI 提供的每个订阅级别的所有用户使用。免费层用户对完整 GPT-4 modelv 的访问权限有限（3 小时内约 80 次聊天），然后切换到更小且功能较差的 GPT-4o mini，直到冷却计时器重置。要获得额外的 GPT-4 访问权限，并能够使用 Dall-E 生成图像，需要升级到 ChatGPT Plus。要跳至 20 美元付费订阅，只需单击 ChatGPT 侧边栏中的“升级到 Plus”即可。输入信用卡信息后，您将能够在 GPT-4 和旧版本的 LLM 之间切换。

如果您不想付费，还有其他一些方法可以体验 GPT-4 的强大功能。首先，您可以将其作为 Microsoft Bing Chat 的一部分进行尝试。微软透露，它一直在 Bing Chat 中使用 GPT-4，并且完全免费使用。然而，Bing Chat 缺少一些 GPT-4 功能，但它显然与微软自己的一些专有技术相结合。但您仍然可以访问扩展的 LLM（大型语言模型）及其附带的高级智能。值得注意的是，虽然 Bing Chat 是免费的，但每个会话仅限 15 次聊天，每天仅限 150 个会话。

目前还有许多其他应用程序也在使用 GPT-4 ，例如问答网站 Quora。

GPT-4 何时发布？

GPT-4 于 3 月 13 日正式发布，并得到了 Microsoft 的提前确认，并首先通过 ChatGPT-Plus 订阅和 Microsoft Copilot 向用户提供。 GPT-4 还作为 API 提供，“供开发人员构建应用程序和服务”。一些已经集成 GPT-4 的公司包括 Duolingo、Be My Eyes、Stripe 和 Khan Academy。 GPT-4 的首次公开演示在 YouTube 上进行了直播，展示了其新功能。

什么是 GPT-4o 迷你？

GPT-4o mini 是 OpenAI GPT-4 模型系列的最新版本。它是较大 GPT-4o 模型的简化版本，更适合简单但大批量的任务，这些任务从快速的推理速度中获益，而不是利用整个模型的强大功能。

GPT-4o mini 于 2024 年 7 月发布，并取代 GPT-3.5，成为用户在达到GPT-4o的三小时查询限制后在 ChatGPT 中交互的默认模型。根据Artificial Analysis的数据，4o mini 在 MMLU 推理基准测试中明显优于类似尺寸的小型模型，例如 Google 的 Gemini 1.5 Flash 和 Anthropic 的 Claude 3 Haiku。

GPT-4 比 GPT-3.5 更好吗？

ChatGPT的免费版本最初基于GPT 3.5模型；然而，截至 2024 年 7 月，ChatGPT 现在在 GPT-4o mini 上运行。这款大型 GPT-4o 型号的简化版本甚至比 GPT-3.5 Turbo 还要好得多。它可以理解并响应更多的输入，拥有更多的保障措施，提供更简洁的答案，并且运营成本降低 60% 。

GPT-4 API

如前所述，GPT-4 可作为 API 提供给过去至少成功向 OpenAI 付款过一次的开发人员。该公司提供多个版本的 GPT-4以及旧版 GPT-3.5 模型，供开发人员通过其 API 使用。在发布 GPT-4o mini 后，OpenAI 指出 GPT-3.5 将继续供开发人员使用，但最终将被下线。该公司没有设定何时实际发生这种情况的时间表。

该 API 主要专注于开发新应用程序的开发人员，但它也给消费者带来了一些困惑。 Plex 允许您将 ChatGPT 集成到服务的 Plexamp 音乐播放器中，这需要 ChatGPT API 密钥。这是与 ChatGPT Plus 分开购买的，因此如果需要，您需要注册开发者帐户才能获得 API 访问权限。

GPT-4 是否变得更糟？

尽管 GPT-4 首次推出时给人们留下了深刻的印象，但一些用户注意到在接下来的几个月里它的答案有所下降。它已经被开发者社区的重要人物注意到，甚至被直接发布到 OpenAI 的论坛上。不过，这都是轶事，OpenAI 的一位高管甚至在 Twitter 上劝阻了这种说法。根据 OpenAI 的说法，这一切都在我们的脑海中。

不，我们并没有让 GPT-4 变得更愚蠢。恰恰相反：我们让每个新版本都比前一个版本更智能。
目前的假设：当您更频繁地使用它时，您会开始注意到以前没有看到的问题。
—彼得·韦林德 (@npew) 2023 年 7 月 13 日

然后，发表的一项研究表明，随着模型的未来更新，答案的质量确实会恶化。通过比较 3 月和 6 月之间的 GPT-4，研究人员能够确定 GPT-4 的准确率从 97.6% 下降到 2.4%。

这不是确凿的证据，但用户所注意到的似乎不仅仅是想象出来的。

GPT-4 中的视觉输入在哪里？

GPT-4 最令人期待的功能之一是视觉输入，它允许 ChatGPT Plus 与图像（而不仅仅是文本）进行交互，从而使模型真正实现多模式。上传图像供 GPT-4分析和操作就像上传文档一样简单 – 只需单击上下文窗口左侧的回形针图标，选择图像源并将图像附加到提示中即可。

GPT-4 有哪些限制？

在讨论 GPT-4 的新功能时，OpenAI 还指出了新语言模型的一些局限性。与之前版本的 GPT 一样，OpenAI 表示最新模型仍然存在“社会偏见、幻觉和对抗性提示”等问题。

换句话说，它并不完美。它仍然会得到错误的答案，并且网上有很多例子证明了它的局限性。但 OpenAI 表示，这些都是该公司正在努力解决的问题，总的来说，GPT-4 的答案“缺乏创意”，因此不太可能编造事实。

另一个主要限制是 GPT-4 模型是在 2023 年 12 月之前根据互联网数据进行训练的（GPT-4o 和 4o mini 于当年 10 月停止）。然而，由于 GPT-4 能够进行网络搜索，而不仅仅是依赖其预先训练的数据集，因此它可以轻松地从互联网上搜索和追踪更新的事实。

当然，GPT-4o 是最新版本， GPT-5仍在推出。