生成式人工智能领域的最新趋势之一是人工智能代理,谷歌可能正在准备自己的代理,作为即将推出的 Gemini 大语言模型 (LLM) 的一个功能。
这项名为 Project Jarvis 的开发项目是一个基于 Google Chrome 浏览器的人工智能代理,在收到简短的查询或命令后,它能够比以前更加独立地执行常见任务。据The Information报道,下一次 Chrome 更新中包含的人工智能代理有可能成为该浏览器自 2008 年推出以来最大规模的改革。
谷歌已经通过其当前的 Gemini 1.5 Pro 模型展示了 Gemini 如何成为购物伴侣或旅行规划者,该模型为 Gemini Advanced 聊天机器人提供支持。在未来的模型中,Jarvis 项目将能够完成各种任务,例如访问网站、填写表格和付款以完成用户提出的查询。
例如,Gemini 1.5 Pro 模型将能够执行查询“计划 12 月的假期,预算为 2,000 美元”; Jarvis 项目可能能够执行查询“为我计划 12 月的假期,预算为 2,000 美元。预订航班和酒店并将详细信息发送到我的电子邮件,” 汤姆指南指出。
贾维斯(Jarvis),或者说“只是一个非常智能的系统”,是对《钢铁侠》中托尼·斯塔克的人工智能助手的致敬。虽然官方名称目前仍未知,但随着谷歌为其模型添加功能,这个代号是合适的。
自 5 月份以来,谷歌在Google I/O 开发者大会上分享了有关 AI 代理的详细信息,并指出该技术将有助于处理语音和视频内容,并在对话中实现更快的响应时间。
如前所述,Jarvis 项目可能是 Google 下一个 LLM 的特色之一,据传该项目是 Gemini 2.0。 The Information 指出,生成式人工智能可能会在 12 月初发布,但没有透露其应用范围。
随着谷歌可能准备发布自己的人工智能代理,许多其他品牌已经展示了自己的类似功能迭代。 Anthropic品牌最近发布了其Computer Use代理,该代理允许Claude LLM作为设备用户独立完成任务。该功能目前处于测试阶段。类似地, OpenAI 的Swarm Framework 是一个共同协作完成任务的代理系统。该公司表示,这项技术仍处于研究和教育实验阶段。