不要对三星 Galaxy S24 的人工智能功能太兴奋

黄色三星 Galaxy S24 的渲染图。
亚瑟·卢平 / X

“移动人工智能的新时代。”这就是三星宣传其即将推出的Galaxy S24 系列智能手机的方式。对于本月晚些时候举行的 Unpacked 活动,该公司承诺“由人工智能驱动的全新移动体验”。

三星并不是第一个涉足由ChatGPTMidjourney等公司掀起的人工智能炒作的公司。高通和联发科这两家智能手机芯片巨头最近大肆展示了其最新旗舰和中端处理器的设备端生成人工智能功能。

这种转变是显而易见的。人工智能将成为手机的营销流行语。但我们究竟是为了什么?这些所谓的“人工智能进步”将如何增加任何有意义的价值仍然是一个秘密。或者它可能只是一个现有的技巧,等待以不同的名称或本机应用程序重新打包。

三星能否兑现承诺,否则就会惨遭失败

三星 Galaxy AI 预告片。
这最好不是一个噱头,三星。三星

我们先从 Galaxy S24 系列手机开始。它们将配备高通 Snapdragon 8 Gen 3 芯片。这家芯片制造商对其新顶级芯片组的生成人工智能功能做出了一些大胆的宣称。例如,据说使用稳定扩散人工智能技术可以在一秒钟内根据文本提示生成图像。

高通公司就如何优化稳定扩散技术以实现设备上的操作提供了令人着迷的技术解释。竞争对手联发科还声称,其旗舰产品天玑 9300的设备上人工智能功能将允许在稳定扩散的情况下在不到一秒的时间内生成文本到图像。

现在,我们已经拥有一款搭载高通最新旗舰产品的手机。该设备是iQoo 12 ,但有趣的是,该手机的营销材料没有提及任何生成式 AI 技巧,尤其是高通和联发科大肆宣传的那种。

我们假设三星将成为提供文本到图像生成功能的公司。最终它会实现什么目标?目前,我们不知道文本到图像的技巧是否会捆绑在第三方应用程序中,或者三星是否会将其集成到其应用程序之一中。

真正的问题是它将为我们的日常智能手机使用模式增加多少价值。一般 Galaxy S24 买家会如何处理通过单行文本提示生成的图像?也许,他们会使用这些人工智能生成的图像来增加聊天的热情或在社交媒体上引起轰动。

但这里仍然存在一些摩擦。您必须从一行文本生成这些图像,将它们保存在本地(或直接将它们复制到剪贴板),然后将这些 AI 图像粘贴到您选择的聊天应用程序中。最好的解决方案是三星以某种方式将图像到文本的生成技巧集成到键盘中。

高通针对手机的稳定扩散演示。
高通

再说一次,当表情符号、GIF 和贴纸都可以做到这一点时,为什么要费那么多麻烦呢?此外,512 x 512 像素的输出分辨率不足以将这些 AI 生成的图像放入大学作业或工作演示中。

此外,该系统可能不会免费。联发科技的演示视频提到了高级选项。当 Galaxy S24 购物者达到一定数量的输出时,他们可能最终会遇到文本到图像令牌的限制,之后他们要么被降级到较慢的图像生成速度层,要么被要求支付订阅费。

但如果这是事实,那么整个问题就没有意义了,因为我们已经有了像OpenAI 的 Dall-E这样的解决方案。您可以免费使用它生成图像,也可以付费购买ChatGPT Plus ,以享受使用最新的 Dall-E 3 模型更快、更详细地生成图像的好处。这只是众多文本到图像生成器之一。

高通表示,Snapdragon 8 Gen 3 是“首款支持多模态 Gen AI 模型的处理器”。这意味着在手机上本地运行的聊天机器人(基于 Meta 的 Llama 模型)将接受文本、图像以及语音形式的输入。再说一遍,这并不是独一无二的,因为 ChatGPT-4 已经提供了该功能,尽管需要订阅墙。

我们真的需要它吗?

手机上的 Snapdragon AI 助手。
高通

高通宣传的最有前途的功能之一是人工智能图像扩展。本质上,你可以向任何你想要的方向扩展图像的画布,设备上的生成​​人工智能将根据你的文本提示智能地生成像素,并向原始框架添加更多对象。

目睹这个技巧真是太神奇了——看到图像随着更多物体的添加而扩大,视野也变宽,就像一位画家正在修饰他的作品一样。但您不想对在手机上单击以将其保存为内存的图片执行此操作。对它们使用生成式人工智能扩展就像用你从未真正经历过的虚假视觉效果和场景污染你的记忆。

总结是手机上生成式人工智能部署的另一个大赌注。它非常适合阅读新闻并了解不同领域的最新发展。然而,只有在摩擦最小的情况下,这个技巧才会脱颖而出。例如,如果用户可以在同一浏览器页面上总结新闻文章,而不用打开另一个应用程序。

如果是后者,为什么不直接转向已经这样做的应用程序呢?例如, Artifact 是一款由 Instagram 联合创始人 Kevin Systrom 设计的令人惊叹的应用程序,它使用人工智能为您总结文章。

已经有一些应用程序和网站以摘要形式提供新闻,例如 Inshorts。对于您的收件箱, Shortwave 是一款出色的应用程序,它不仅可以为您汇总电子邮件链,而且无需额外付费。

在 Shortwave 中发送电子邮件摘要
像 Shortwave 这样的应用程序非常适合总结您的电子邮件链。纳迪姆·萨瓦尔 / 数字趋势

设备上的生成​​人工智能也有望实现基于语音的照片编辑等技巧。这听起来非常方便,但很难想象当一键式过滤器和精细滑块提供同样快速且更有价值的手机媒体编辑流程时,它会给我们的生活带来多少便利。

接下来,让我们转向使用人工智能进行一些通用聊天或获取答案的基本情况,否则需要互联网推动的研究。我们将再次遇到定性问题。

由于资源的基本可用性,在手机上本地运行的生成式人工智能模型(例如 Meta 的 Llama)并不是同类中最先进的。谷歌就是你的最佳选择。 Pixel 8 Pro 仅运行 Google 大型语言模型中最小的一种,称为 Gemini Nano 。为什么不通过 ChatGPT 或 Pi 等专用移动应用程序跳转到类似的语言模型,而不是选择能力较差的语言模型呢?

生成式人工智能真正需要的地方

AI助手与ChatGPT的比较。
纳迪姆·萨瓦尔 / 数字趋势

目前,我认为生成式人工智能的最佳技巧是将智能手机任务与云(以及始终在线的要求)解耦,并提供额外的安全性。但要做到这一点,这些设备上的人工智能技巧需要兼具助手的功能,有点像 Google Assistant、Alexa 或 Siri。

或者更好的是,他们需要成为助理的一部分。让你的生成人工智能助手从你的库中拾取所有猫的图像,将它们编织成拼贴画,然后将它们发送给你的爸爸。或者,让它规划迪士尼乐园一日游的最佳行程,为您找到下周末最便宜的门票,并在 Google 日历上整齐地安排所有这些详细信息。

此外,如果设备上的生成​​式人工智能工具不再将您的数据推送到云服务器并将每个操作保留在您的智能手机本地,那么就无需担心数据隐私。至少理论上是这样。目前,我不确定三星正在销售的 Galaxy AI 愿景,但看看三星是否能够真正提供有意义的生成式 AI 体验,或者只是一堆几乎不实用的噱头,这将是很有趣的。


Posted

in

by

Tags: