苹果今年早些时候引人注目的 WWDC 活动的最大收获是 Siri 在人工智能时代的下一步发展。不幸的是,许多有希望的升级尚未面向大众,而且已经可用的任何东西都不是真正具有开创性的。
尽管救赎似乎还很遥远,但前方的道路看起来并不算太暗淡。
据彭博社报道,苹果内部正在开发基于先进人工智能堆栈的 LLM Siri,该堆栈允许助手进行来回对话并处理更复杂的查询。
LLM 是大型语言模型的缩写,是为 OpenAI 的 ChatGPT 和 Google 的 Gemini 等对话产品提供动力的秘密武器。苹果对 LLM Siri 的意图并没有偏离太多,因为该公司希望它的行为方式与 Gemini 大致相同。
报告称:“改进后的 Siri 将依靠新的 Apple AI 模型来更像人类一样进行交互。”并补充说,该公告将于 2025 年某个时候发布,随后于 2026 年春季发布。
现在,这还没有赶上竞争对手。您已经可以在很大程度上在 iPhone 上体验到这些好处。 Siri-ChatGPT 集成现已在 iOS 测试版本中上线,可以实现这一目标。
谷歌最近发布了适用于 iPhone 的独立 Gemini 应用程序,该应用程序还将 Gemini Live 对话模式引入了苹果智能手机。这就引出了一个重要的问题:既然竞争对手的产品已经提供了便利,为什么还要等待一年多呢?
这里还值得注意的是,苹果将正式添加对更多第三方语言模型的支持,例如 ChatGPT,作为 Apple Intelligence 捆绑包的一部分。据彭博社报道,谷歌的 Gemini 集成已经在等待中。
目前,苹果追赶虚拟助手竞争的尝试进展缓慢得惊人。谷歌已经将谷歌助理的许多职责交给了 Gemini,它与 Gmail 和 Docs 等工具的集成已经非常有价值。
OpenAI 还推出了 ChatGPT 搜索,使用户可以更轻松地在网络上查找信息,但比 Google 搜索更具对话性。但这还不是全部。 这家微软支持的公司的下一步行动是推出网络浏览器。 Perplexity还推出了自己的搜索和购物产品。
据报道,LLM Siri 最显着的升级是它与应用程序交互的能力。彭博社报道称:“它还将扩大应用程序意图的使用,从而可以更精确地控制第三方应用程序。”
从用户的角度来看,让 Siri 跨不同应用程序执行任务长期以来一直是一个梦想。尽管距离现在还需要一年多的时间,但现在看来这个未来已经迫在眉睫。但苹果公司再一次不会成为这一追求中的孤独战士。
Android Authority报告称,在Android 16 (已经推出开发者预览版)中,Gemini 可以获得跨第三方应用程序执行任务的能力。到目前为止,Gemini 的活动仅限于 Gmail、文档和日历等工作空间工具。
看来苹果在 LLM Siri 的计划上确实迈出了正确的一步。但当所有这些预言都成为现实时,凭借扎实的对话式人工智能技术的良好记录,这场竞争将遥遥领先。