当ChatGPT出现时,人们惊叹不已,对其作为最初由 GPT-3.5 大语言模型支持的人工智能聊天机器人的自然语言能力印象深刻。但当备受期待的 GPT-4 大语言模型问世时,它揭开了我们对人工智能的想象,有人称其为AGI(通用人工智能)的早期雏形。
什么是 GPT-4?
GPT-4是OpenAI创建的最新语言模型,可以生成类似于人类语音的文本。它改进了 ChatGPT 使用的技术,ChatGPT以前基于 GPT-3.5,但后来进行了更新。 GPT 是 Generative Pre-trained Transformer 的缩写,是一种利用人工神经网络像人类一样写作的深度学习技术。
据 OpenAI 称,这种下一代语言模型在三个关键领域比 ChatGPT 更先进:创造力、视觉输入和更长的上下文。在创造力方面,OpenAI 表示 GPT-4 在创建和与用户协作开展创意项目方面要好得多。其中的例子包括音乐、剧本、技术写作,甚至“学习用户的写作风格”。
较长的上下文也会影响这一点。 GPT-4 现在可以处理来自用户的多达 128k 个文本标记。您甚至可以只向 GPT-4 发送一个网络链接,并要求它与该页面的文本进行交互。 OpenAI 表示,这有助于创建长篇内容以及“扩展对话”。
GPT-4 现在还可以接收图像作为交互的基础。在 GPT-4 网站上提供的示例中,聊天机器人获得了一些烘焙原料的图像,并被询问可以用它们制作什么。目前尚不清楚视频是否也可以以同样的方式使用。
最后,OpenAI 还表示 GPT-4 比上一代使用起来更加安全。据报道,在 OpenAI 自己的内部测试中,它可以产生多 40% 的事实响应,同时“响应禁止内容的请求”的可能性也降低了 82%。
OpenAI 表示,它已经接受了人类反馈的培训,以取得这些进步,并声称已与“50 多名专家合作,在包括人工智能安全和保障在内的领域提供早期反馈”。
在它首次推出后的最初几周内,用户发布了他们用它所做的一些令人惊奇的事情,包括发明新语言、详细说明如何逃离现实世界,以及从头开始为应用程序制作复杂的动画。一名用户显然让GPT-4 使用 HTML 和 JavaScript 的混合在短短 60 秒内创建了 Pong 的工作版本。
如何使用 GPT-4
GPT-4 可供 OpenAI 提供的每个订阅级别的所有用户使用。免费层用户对完整 GPT-4 modelv 的访问权限有限(3 小时内约 80 次聊天),然后切换到更小且功能较差的 GPT-4o mini,直到冷却计时器重置。要获得额外的 GPT-4 访问权限,并能够使用 Dall-E 生成图像,需要升级到 ChatGPT Plus。要跳至 20 美元付费订阅,只需单击 ChatGPT 侧边栏中的“升级到 Plus”即可。输入信用卡信息后,您将能够在 GPT-4 和旧版本的 LLM 之间切换。
如果您不想付费,还有其他一些方法可以体验 GPT-4 的强大功能。首先,您可以将其作为 Microsoft Bing Chat 的一部分进行尝试。微软透露,它一直在 Bing Chat 中使用 GPT-4,并且完全免费使用。然而,Bing Chat 缺少一些 GPT-4 功能,但它显然与微软自己的一些专有技术相结合。但您仍然可以访问扩展的 LLM(大型语言模型)及其附带的高级智能。值得注意的是,虽然 Bing Chat 是免费的,但每个会话仅限 15 次聊天,每天仅限 150 个会话。
目前还有许多其他应用程序也在使用 GPT-4 ,例如问答网站 Quora。
GPT-4 何时发布?
GPT-4 于 3 月 13 日正式发布,并得到了 Microsoft 的提前确认,并首先通过 ChatGPT-Plus 订阅和 Microsoft Copilot 向用户提供。 GPT-4 还作为 API 提供,“供开发人员构建应用程序和服务”。一些已经集成 GPT-4 的公司包括 Duolingo、Be My Eyes、Stripe 和 Khan Academy。 GPT-4 的首次公开演示在 YouTube 上进行了直播,展示了其新功能。
什么是 GPT-4o 迷你?
GPT-4o mini 是 OpenAI GPT-4 模型系列的最新版本。它是较大 GPT-4o 模型的简化版本,更适合简单但大批量的任务,这些任务从快速的推理速度中获益,而不是利用整个模型的强大功能。
GPT-4o mini 于 2024 年 7 月发布,并取代 GPT-3.5,成为用户在达到GPT-4o的三小时查询限制后在 ChatGPT 中交互的默认模型。根据Artificial Analysis的数据,4o mini 在 MMLU 推理基准测试中明显优于类似尺寸的小型模型,例如 Google 的 Gemini 1.5 Flash 和 Anthropic 的 Claude 3 Haiku。
GPT-4 比 GPT-3.5 更好吗?
ChatGPT的免费版本最初基于GPT 3.5模型;然而,截至 2024 年 7 月,ChatGPT 现在在 GPT-4o mini 上运行。这款大型 GPT-4o 型号的简化版本甚至比 GPT-3.5 Turbo 还要好得多。它可以理解并响应更多的输入,拥有更多的保障措施,提供更简洁的答案,并且运营成本降低 60% 。
GPT-4 API
如前所述,GPT-4 可作为 API 提供给过去至少成功向 OpenAI 付款过一次的开发人员。该公司提供多个版本的 GPT-4以及旧版 GPT-3.5 模型,供开发人员通过其 API 使用。 在发布 GPT-4o mini 后,OpenAI 指出 GPT-3.5 将继续供开发人员使用,但最终将被下线。该公司没有设定何时实际发生这种情况的时间表。
该 API 主要专注于开发新应用程序的开发人员,但它也给消费者带来了一些困惑。 Plex 允许您将 ChatGPT 集成到服务的 Plexamp 音乐播放器中,这需要 ChatGPT API 密钥。这是与 ChatGPT Plus 分开购买的,因此如果需要,您需要注册开发者帐户才能获得 API 访问权限。
GPT-4 是否变得更糟?
尽管 GPT-4 首次推出时给人们留下了深刻的印象,但一些用户注意到在接下来的几个月里它的答案有所下降。它已经被开发者社区的重要人物注意到,甚至被直接发布到 OpenAI 的论坛上。不过,这都是轶事,OpenAI 的一位高管甚至在 Twitter 上劝阻了这种说法。根据 OpenAI 的说法,这一切都在我们的脑海中。
不,我们并没有让 GPT-4 变得更愚蠢。恰恰相反:我们让每个新版本都比前一个版本更智能。
目前的假设:当您更频繁地使用它时,您会开始注意到以前没有看到的问题。
—彼得·韦林德 (@npew) 2023 年 7 月 13 日
然后, 发表的一项研究表明,随着模型的未来更新,答案的质量确实会恶化。通过比较 3 月和 6 月之间的 GPT-4,研究人员能够确定 GPT-4 的准确率从 97.6% 下降到 2.4%。
这不是确凿的证据,但用户所注意到的似乎不仅仅是想象出来的。
GPT-4 中的视觉输入在哪里?
GPT-4 最令人期待的功能之一是视觉输入,它允许 ChatGPT Plus 与图像(而不仅仅是文本)进行交互,从而使模型真正实现多模式。上传图像供 GPT-4分析和操作就像上传文档一样简单 – 只需单击上下文窗口左侧的回形针图标,选择图像源并将图像附加到提示中即可。
GPT-4 有哪些限制?
在讨论 GPT-4 的新功能时,OpenAI 还指出了新语言模型的一些局限性。与之前版本的 GPT 一样,OpenAI 表示最新模型仍然存在“社会偏见、幻觉和对抗性提示”等问题。
换句话说,它并不完美。它仍然会得到错误的答案,并且网上有很多例子证明了它的局限性。但 OpenAI 表示,这些都是该公司正在努力解决的问题,总的来说,GPT-4 的答案“缺乏创意”,因此不太可能编造事实。
另一个主要限制是 GPT-4 模型是在 2023 年 12 月之前根据互联网数据进行训练的(GPT-4o 和 4o mini 于当年 10 月停止)。然而,由于 GPT-4 能够进行网络搜索,而不仅仅是依赖其预先训练的数据集,因此它可以轻松地从互联网上搜索和追踪更新的事实。
当然,GPT-4o 是最新版本, GPT-5仍在推出。