苹果内部人士刚刚透露了 iOS 18 的人工智能功能将如何运作

iPhone 15 Pro Max 正面朝下放在外面,呈现自然钛色。
乔·马林/数字趋势

随着苹果全球开发者大会 (WWDC) 的临近,围绕该公司人工智能工作的讨论也变得异常激烈。在智能手机和计算品牌只专注于人工智能细节的一年里,苹果公司却一反常态地对人工智能炒作保持沉默——引发了人们对该品牌错过火车的担忧。

然而,一份新报告让我们更仔细地了解了苹果的人工智能梦想如何通过今年晚些时候的 iOS 18 更新实现。

苹果人工智能计划的新细节

Apple iPhone 15 Plus 上的主屏幕。
安迪·博克索尔 / 数字趋势

苹果似乎非常热衷于这场游戏,但其做法与竞争对手略有不同。 “苹果一直在开发一种大型语言模型——支持生成人工智能功能的算法——所有迹象都表明它将完全在设备上运行。这意味着该技术由 iPhone 内部的处理器提供支持,而不是云端,” 彭博社报道。

关于代号为“AppleGPT”的内部工具的谣言已经流传了一段时间。但苹果似乎还没有完全达到谷歌和微软(使用 OpenAI)等公司通过 ChatGPT、Copilot 和Gemini等工具所达到的技巧水平。这也解释了最近有报道称,苹果可能会像三星和一加一样,从谷歌获得 Gemini AI 许可用于 iPhone,而不是提供一款不太引人注目的产品。

或者,更准确地说,它不符合苹果的标准。生成式人工智能工具,即使是那些建立在最大数据集之上的工具,仍然以相当惊人的方式失败,至少在其早期是这样。谷歌最近不得不就 Gemini AI 文本到图像系统的严重失误道歉。 Meta 的人工智能也不甘落后。然后,围绕版权法、公平披露和培训透明度的整个风暴正在酝酿,而这是苹果希望避免的。

iPhone 上的 Siri。
Siri 的人工智能革命即将到来吗?所有迹象都指向 WWDC 的启示。纳迪姆·萨瓦尔 / 数字趋势

但苹果似乎不想推销众所周知的人工智能万金油,而是想采取更加谨慎的做法。彭博社报道补充道:“苹果公司计划展示该技术如何帮助人们的日常生活,而不是宣扬聊天机器人和其他生成式人工智能工具的强大功能。”

自从 ChatGPT 出现并掀起了一场人工智能革命以来,我们目睹了大量的人工智能工具,它们能够生成逼真的图片和克隆声音,从文本制作逼真的视频,到作为虚拟伙伴进行古怪的聊天。然而,最大的问题是这些华而不实的技巧对于普通消费者的日常来说有多大的实际回报。

但这并不意味着苹果没有试图在人工智能竞赛中脱颖而出。事实上恰恰相反。在过去的几个月里,苹果公司发布了多篇研究论文,记录了一种名为MGIE的人工智能工具,该工具能够使用语音命令进行媒体编辑等功能。另一篇详细介绍了MM1 ,这是一种多模态大语言模型,为“增强的上下文学习和多图像推理”打开了大门。

苹果在人工智能竞赛中走了多远?

iPhone 14 背面的 Apple 标志。
乔·马林/数字趋势

我们最近剖析了苹果的另一项研究,该研究的重点是人工智能理解屏幕内容并相应地为用户提供帮助。以下是一位 Apple 工程师在 X(以前称为 Twitter)上发布的帖子,详细介绍了 Apple 与 Google Gemini AI 模型等竞争对手相比所取得的进展:

其他论文在隐私和安全的范围讨论了人工智能,这对苹果来说并不奇怪。上面提到的设备上方法是整个隐私方法的核心。在设备上运行人工智能模型将确保没有数据离开 iPhone。这与将用户请求发送到云服务器形成鲜明对比,这种策略也会减慢整个人类与人工智能交互链的速度。

另外,苹果已经准备好了核心硬件。自 2017 年以来,该公司一直在 iPhone 中搭载神经处理单元 (NPU)。这是一种专用的 AI 加速器硬件,其工作原理与 Google Pixel 智能手机中的张量处理单元 (TPU) 相同,后者现在能够运行 Gemini设备上的模型。有趣的是,苹果不久前也开始奠定基础。

在 WWDC 2022 上,该公司发布了所谓的“Transformer 架构的开源参考 PyTorch 实现”。 Transformer 是整个生成式人工智能技术背后的基础工具。 《金融时报》的这篇文章对 Transformer 技术进行了精彩(且令人愉快的)解释,该技术源自 2017 年 Google 的一篇研究论文,同年我们在 iPhone X 中安装了 NPU。

彭博社最新报道指出,苹果将在 6 月开幕的 WWDC 2024 上展示其人工智能方法。设备上的生成​​式人工智能方法最终会让 Siri 变得更加智能吗?就像谷歌最近试图增强 Google Assistant 的方式一样?只有时间会给出答案。


Posted

in

by

Tags: