不久前,有传言称苹果公司正在内部开发一款名为Apple GPT 的产品,这是一款基于该公司自己的 AI 模型的聊天机器人,其目标是模仿OpenAI 的 ChatGPT 的功能。在接下来的几个月里,我们看到生成式人工智能产品随处可见,从 Google Pixels 和三星 Galaxy S24 手机到Nothing Phone 2a 等新贵。
与此同时,我们从苹果那里得到的只是模糊但大胆的声明。苹果首席执行官蒂姆·库克告诉投资者,苹果的生成式人工智能推动将在今年晚些时候推出,“开辟新天地”。然而,苹果似乎将得到谷歌的帮助来实现这些梦想。或者甚至 OpenAI 也会来救援。
据彭博社报道,据报道,苹果正在与谷歌就 iPhone 的 Gemini AI 模型授权进行谈判。这听起来与三星在 Galaxy S24 系列手机上遵循的策略相同,该手机可以在设备上运行谷歌的 Gemini Nano 模型,而更强大的版本可以在云端使用。
该交易的条款尚未最终确定,据说讨论仍在不断变化。不过,据报道,苹果也在与 OpenAI 进行谈判。回想一下,OpenAI 的基础技术(例如 GPT-4 模型和 Dall-E)目前可在 Microsoft 的产品套件中以及通过ChatGPT Plus等独立应用程序和服务使用。这是苹果人工智能雄心的一个有趣的发展——让我既兴奋又担心。
苹果的人工智能之旅(到目前为止)
在 2023 年的最后一个月,苹果公司在 MLX 小组下推出了一系列模型库和框架,旨在在其专有芯片上运行。此举旨在为 Mac 系列引入生成式 AI 功能,类似于高通在 Snapdragon X Elite 平台上所做的努力。
今年年初,苹果研究部门发表了一篇关于名为Keyframer的生成式人工智能工具的论文,该工具使用户能够制作动画内容。它基本上基于 OpenAI 的 GPT-4 模型,但它结合了矢量图形来处理静态图像。
此外,苹果专家还推出了一篇研究论文,描述了一种人工智能工具,可以通过简单的口头指令来促进图像编辑。该功能与高通最新的顶级 Snapdragon 芯片所宣传的语音辅助媒体编辑工具包相似。
彭博社随后的一份报告强调,苹果一直在扩大负责检查生成式人工智能功能的专门团队,其宏伟目标是到 2024 年让开发人员可以使用这些工具。
有传言称,苹果的首批生成式人工智能功能将在 iOS 18 中首次亮相,该系统预计将于 6 月发布。但根据彭博社的最新报告,这些功能面向本地设备系统,而不是通常与云连接的真正生成式人工智能设施,例如 ChatGPT、Gemini 或 Perplexity 提供的设施。
9 月, The Information透露,苹果一直在开发旨在增强 Siri 的“基础模型”。据称,这一举措与 Gemini 推进 Google Assistant 的方式类似。
Gemini 可以在 iPhone 上做什么?
现在,Gemini 在本地运行和连接到互联网时为手机带来了大量功能。当在设备上实现时,就像Google Pixel 8 Pro一样,即使手机处于离线状态,它也可以在录音机应用程序中总结对话。
对于运行 Gboard 键盘应用程序的用户,Gemini Nano 带来了智能回复功能,首先是 WhatsApp 等应用程序。简而言之,它会读取您的对话,并根据上下文相应地建议回复。设备上的人工智能还添加了离线翻译,该功能已在支持 Gemini 的三星 Galaxy S24系列手机上提供。
现在,通过在手机上安装 Gemini 应用程序,它可以完成以下任务。
- 就像 Google Assistant 或 ChatGPT 一样,您可以与 Gemini 进行自然语言对话,并获得写作、提出想法等方面的帮助。
- 激活工作区扩展后,快速总结电子邮件或文件中的信息。信息可以以列表、图表和表格等格式进行汇总。
- 使用 OpenAI 的 Dall-E 引擎的文本提示生成图像。
- 获取以新方式使用相机的帮助。在 Gemini 应用程序中,将相机对准场景并向 AI 询问有关帧中物体的信息。
- 了解屏幕上显示的内容。使用“Hey Google”命令召唤 Gemini 来完成工作。例如,它可以总结您当前正在阅读的文章。
- 使用 Google 地图和 Google 航班来计划旅行,甚至创建定制的行程。
苹果与谷歌的人工智能交易可能会如何展开
如上所述,三星与谷歌密切合作,让 Gemini Nano AI 模型在其旗舰手机上运行。但 Gemini 不仅仅局限于旗舰产品。今年 2 月,联发科宣布中端天玑 8300芯片现已与旗舰天玑 9300一起针对 Google Gemini 进行优化。
为苹果公司做类似的事情应该不会太麻烦。如果设备上的许可交易没有成功,那么总是有申请途径。目前还不清楚,假设这笔交易首先完成,苹果会采取什么策略。
更大的问题是 Gemini 授权协议是否会有意义地改变用户与 iPhone 的交互方式。更重要的是,Gemini 会为 Siri 带来任何改变吗?坦白说,Siri 在赶上 Google Assistant 之前还有很多路要走。
但即便如此,谷歌也还没有完全弄清楚 Gemini 的存在,或者完全取代 Google Assistant。现在,当您在 Android 手机上安装 Gemini时,它会取代 Google Assistant。或者,至少,它试图这样做。
您的手机仍然依赖 Google Assistant 来执行各种平凡但有意义的任务,例如拨打电话、设置闹钟、发送消息、控制智能家居设备以及创建日历条目。同样,对于导航、Gboard 中的语音输入和 Android Auto,Google Assistant 仍然是值得信赖的人工智能,而不是 Gemini。
此外,Google Assistant 仍然是智能显示器和 Wear OS 智能手表上的首选人工智能伴侣。考虑到苹果公司将其软件在整个硬件生态系统中紧密地交织在一起,特别是在 iPhone 和 Apple Watch 之间,Gemini、Google Assistant 和/或 Siri 只承担一部分责任的交错方式将会给用户带来很多混乱。普通用户。
或者,苹果可以与谷歌密切合作,创建独家集成,将 Gemini 与苹果生态系统功能(如 Siri、邮件、便笺、Safari、日历、健康等)联系起来。然而,考虑到 Gemini 数据存储策略的现状,我们并没有对如此紧密的系统级集成抱有期待。
Gemini 对苹果的风险
当然,苹果错过了智能手机上生成式人工智能的第一波浪潮,如果报道可信的话,该公司正在疯狂地努力追赶。但 Gemini 许可协议也意味着我们可能永远看不到苹果自己在“Ajax”项目下进行的生成式人工智能开发工作。或者也许我们只会看到它的稀释形式,而 Gemini 在 iPhone 上承担人工智能的重任。
但双子座也并非没有缺点。相反,它的失误比任何其他主流生成人工智能工具都更加令人惊讶。几周前,Gemini 用户注意到它生成的图像严重不准确,尤其是肤色、种族和历史准确性处理不当。
争议不断升级,以至于谷歌暂停了 Gemini 的文本到图像创作。 “需要明确的是,这是完全不可接受的,我们错了,”谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)在美国公共广播电台(NPR)报道的一份内部备忘录中写道。
在大西洋彼岸,双子座公司因有关印度总理纳伦德拉的言论被视为贬义并在社交媒体上疯传而陷入另一场争议。印度联邦部长拉吉夫·钱德拉塞卡(Rajeev Chandrasekhar)(通过NDTV )警告说:“简单地说‘……抱歉,它未经测试’不符合我们遵守法律的期望。”
这场争议再次将人工智能监管推入争论,并且还向主要人工智能参与者发布了咨询意见,要求他们在公开发布 Gemini 等工具之前获得明确批准。
对于像苹果这样严格遵守政府法规的公司来说,为全球数亿台设备授权 Gemini 的风险不小。特别是当谷歌本身警告“双子座会犯错误”并表示你应该经常仔细检查是否有不准确之处时。