谷歌前 Android 产品管理副总裁 Hugo Barra周三宣布,他正在领导一家新的初创公司,旨在为人工智能代理开发类似 Android 的操作系统。
“[我们]将回归 Android 根源,为人类和人工智能代理构建一个新的操作系统,”Barra 在 X 上的一篇文章中写道。
我正在与一些我曾经共事过的最优秀的人一起创办一家新公司,我感到无比兴奋。我们称之为/dev/agents。
回到我们的 Android 根源,为人们和用户构建一个新的操作系统。人工智能代理。查看下面@dps的帖子了解更多信息。
—雨果·巴拉 (@hbarra) 2024 年 11 月 26 日
该公司联合创始人兼首席执行官 David Singleton 表示,该公司名为“/dev/agents”,正在致力于开发基于云的“人工智能代理的下一代操作系统”,该系统将“与所有设备上的用户一起工作”在X 的帖子中写道。他认为人工智能代理将“需要新的 UI 模式、重新构想的隐私模型和开发者平台,使构建有用的代理变得更加简单。”
尽管开发人员向GPT-4o 、 Llama 3.1和Gemini 1.5等当前一代大型语言模型投入了越来越多的训练数据、计算能力和资源,但它们仍面临着性能回报递减的局面,人工智能代理越来越被视为下一个主要语言模型生成人工智能技术的进步。与传统应用程序不同,这些代理旨在代表用户自主处理信息、做出决策并执行特定操作。这可以是任何事情,从生成复杂的计算机代码到预订航班和酒店住宿,到转录商务会议,然后根据讨论的内容生成可操作的任务。
新公司的网站是这样描述其使命的:“现代人工智能将从根本上改变人们在日常生活中使用软件的方式。代理应用程序首次使计算机能够像人与人合作一样与人合作。但如果不消除大量阻碍因素,这一切就不会发生。我们需要新的 UI 模式、重新构想的隐私模型和开发者平台,使构建有用的代理变得更加简单。这就是我们正在面临的挑战。”
业界领先的公司已经竞相部署自己的品牌代理商。微软最近宣布将于 2025 年初将代理纳入其 365 Copilot 生态系统。谷歌的 Project Jarvis预计将随下一次 Gemini 更新一起推出,它利用人工智能的功能来执行常见任务,例如访问网站和填写在线表格,按照用户的命令。
OpenAI 的代理(代号为 Operator )将在 1 月份通过公司的开发者 API 作为研究预览版发布时,以大致相同的方式运行。 Anthropic 已经发布了名为Computer Control的代理,它使 Claude 能够模拟人类用户的键盘按下和鼠标点击。
辛格尔顿对彭博社表示:“我们可以看到人工智能代理的前景,但作为一名开发人员,构建任何好的东西太难了。”他指出,该行业需要“一个类似于 Android 的人工智能时刻”。