看起来人工智能助手已经过时了,或者这就是谷歌希望你相信的,因为我们正处于人工智能代理的时代——谷歌 I/O 2024很快就证明了这一点。向 Project Astra 打个招呼,它是一个生成式人工智能代理,具有视觉、文本和语音功能,还具有一定的记忆和空间感知功能。
将其视为手机的眼睛,可以理解您周围的世界。将它指向一个数学方程,它就会解出它。将相机对准猫?阿斯特拉将为猫科动物喵斯特建议一个合适的名字。问它你把耳塞放在哪里,如果摄像头传感器看到它们,它会说“你把它们落在沙发上了”。
Astra 可以理解屏幕上出现的代码、识别对象并解释它们的作用、识别建筑物等等。可以将其视为面向整个世界的 Google 镜头,并且可以理解相机镜头前的大多数事物。
与 Google Assistant 不同,您不需要提示它。只需将摄像头对准任何物体,发出音频查询,Astra 就会以自然语言响应进行解释。谷歌表示,Project Astra 将于今年晚些时候通过 Gemini 应用程序推出。
一个无所不能的人工智能代理?
如果 Project Astra 听起来很熟悉,那是因为OpenAI 就在一天前演示了 ChatGPT 的类似功能— 由新的 GPT-4o 模型提供支持。 OpenAI 的工具目前正处于安全测试的红队阶段,并将分阶段发布,首先从 ChatGPT Plus 订阅者开始。
谷歌不会透露 Astra 是否会有价格标签。但考虑到响应近乎自发性、涉及的视觉数据处理类型以及提供有意义的响应所需的生成能力,由于计算要求,Astra 不太可能作为免费福利。
最好的例子是 Google One AI Premium 订阅,它已经将一些由 Gemini 驱动的新体验隐藏在付费墙后面。但到目前为止,Astra 看起来像是谷歌自几年前凭借 Duplex 的功能让世界惊叹以来所展示的最令人惊叹的人工智能创新。