高级语音模式是ChatGPT的一项新功能,使用户能够与 AI 聊天机器人进行实时、类人的对话,而无需基于文本的提示窗口或来回音频。它在OpenAI 的春季更新活动中首次演示后,于 7 月下旬向精选 Plus 订阅者发布。
据该公司称,该功能“提供更自然、实时的对话,允许您随时打断,并感知和响应您的情绪。 ”它甚至可以在谈话过程中喘息并模拟人类的笑声。最好的部分是,如果您还没有访问权限,即将推出。
我什么时候可以获得高级模式?
上周,OpenAI终于向部分 ChatGPT-Plus 用户发布了备受期待的高级语音功能。所以,有些人已经在使用它了。然而,我们不知道首次推出的规模有多大,也不知道 OpenAI 邀请新成员的速度有多快。
该公司承诺在未来几周内向更多用户推出,并在今年秋天向所有 Plus 订阅者推出,尽管许多用户仍然迫不及待地想亲自尝试。因此,简单的答案是,从现在到秋季之间的某个时间,您将可以访问它,除非有任何进一步的延迟。 “秋季”可能很模糊,但如果我们在 12 月之前没有看到向所有用户全面推出,那就会构成延迟。
无论哪种方式,当您收到一封邀请您尝试的电子邮件时,您就会知道自己具有访问权限。当您打开 ChatGPT 应用程序时,您还会看到一条通知。
在手机上运行高级语音模式需要什么?
除了 Plus 订阅外,用户还需要运行应用程序版本 1.2024.206 或更高版本的 Android 手机,或者使用 iOS 16.4 或更高版本以及应用程序版本 1.2024.206 或更高版本的 iPhone。不幸的是,仅仅拥有合适的设备并不足以保证您进入 alpha 发布阶段。更重要的是,OpenAI 尚未公布有关如何或为何选择用户的任何细节。
如果您确实赢得了 alpha 版本抽签并被选中,OpenAI 会向您发送一封有关此事的电子邮件。您还会在 ChatGPT 移动应用程序的右下角看到一个工具提示,可让您选择新功能。
OpenAI 会使用我的对话来训练其模型吗?
当然。在整个 alpha 发布阶段,OpenAI 计划利用高级语音模式对话中的音频来训练其模型,前提是您尚未关闭应用程序的数据共享选项。
这样做其实很简单。在您的移动应用程序上,转到“设置”菜单中的“数据控制”选项卡,然后取消选择“改善所有人的语音” 。
我可以多久使用一次高级语音模式?
根据 OpenAI 的说法,高级语音的输入和输出都有每日使用限制,但是,没有具体说明这些限制的具体时间,并且“精确限制可能会发生变化”。也就是说,用户 Himels Tech 已经发布了一段自己与 AI 对话的视频,时间长达 10 分钟。
当用户还剩 3 分钟聊天时间时,人工智能会提示用户,然后结束对话并将用户带回标准语音界面。
我可以使用高级语音模式做什么,不能做什么?
汗!!!! pic.twitter.com/xQ8NdEojSX
—伊森·苏丁 (@EthanSutin) 2024 年 7 月 30 日
高级语音模式的核心是一种与人们已经用于基于文本的查询的相同 GPT-4o 大语言模型进行交互的新方式。因此,简而言之,您可以使用 ChatGPT 执行的大多数操作都可以使用高级语音执行,但使用的是有趣的声音。从口技到讲故事,再到非常非常快地计数,早期用户已经开始 试用这项新功能。
然而,用户对新模式的要求存在安全护栏和功能限制。其一,用户无法使用高级语音来创建新的记忆,也无法使用自定义指令或使用它访问 GPT。虽然人工智能会记住之前的高级语音对话,并能够回忆起这些对话的细节,但它还无法访问之前通过文本提示或标准语音模式进行的聊天。
更重要的是,无论你如何要求,高级语音都不会唱歌。该公司表示,“为了尊重创作者的权利,我们采取了多项缓解措施,包括新的过滤器,以防止高级语音模式响应包括唱歌在内的音乐内容。”