这项即将推出的人工智能功能可能会彻底改变谷歌浏览器

谷歌的双子座标志,人工智能在智能手机和个人电脑上运行。
谷歌

生成式人工智能领域的最新趋势之一是人工智能代理,谷歌可能正在准备自己的代理,作为即将推出的 Gemini 大语言模型 (LLM) 的一个功能。

这项名为 Project Jarvis 的开发项目是一个基于 Google Chrome 浏览器的人工智能代理,在收到简短的查​​询或命令后,它能够比以前更加独立地执行常见任务。据The Information报道,下一次 Chrome 更新中包含的人工智能代理有可能成为该浏览器自 2008 年推出以来最大规模的改革。

谷歌已经通过其当前的 Gemini 1.5 Pro 模型展示了 Gemini 如何成为购物伴侣或旅行规划者,该模型为 Gemini Advanced 聊天机器人提供支持。在未来的模型中,Jarvis 项目将能够完成各种任务,例如访问网站、填写表格和付款以完成用户提出的查询。

例如,Gemini 1.5 Pro 模型将能够执行查询“计划 12 月的假期,预算为 2,000 美元”; Jarvis 项目可能能够执行查询“为我计划 12 月的假期,预算为 2,000 美元。预订航班和酒店并将详细信息发送到我的电子邮件,” 汤姆指南指出。

贾维斯(Jarvis),或者说“只是一个非常智能的系统”,是对《钢铁侠》中托尼·斯塔克的人工智能助手的致敬。虽然官方名称目前仍未知,但随着谷歌为其模型添加功能,这个代号是合适的。

自 5 月份以来,谷歌在Google I/O 开发者大会上分享了有关 AI 代理的详细信息,并指出该技术将有助于处理语音和视频内容,并在对话中实现更快的响应时间。

如前所述,Jarvis 项目可能是 Google 下一个 LLM 的特色之一,据传该项目是 Gemini 2.0。 The Information 指出,生成式人工智能可能会在 12 月初发布,但没有透露其应用范围。

随着谷歌可能准备发布自己的人工智能代理,许多其他品牌已经展示了自己的类似功能迭代。 Anthropic品牌最近发布了其Computer Use代理,该代理允许Claude LLM作为设备用户独立完成任务。该功能目前处于测试阶段。类似地, OpenAI 的Swarm Framework 是一个共同协作完成任务的代理系统。该公司表示,这项技术仍处于研究和教育实验阶段。


Posted

in

by

Tags: