在Gemini 1.5首次亮相不到一年后,谷歌 DeepMind 部门周三再次发布了人工智能的下一代模型 Gemini 2.0。该公司在其公告博客文章中写道,新模型提供原生图像和音频输出,“将使我们能够构建新的人工智能代理,使我们更接近通用助理的愿景”。
从周三开始,Gemini 2.0 可在所有订阅级别使用,包括免费订阅。作为谷歌的新旗舰人工智能模型,您可以期望在未来几个月内看到它开始为整个公司生态系统的人工智能功能提供支持。与OpenAI 的 o1 模型一样,Gemini 2.0 的初始版本并不是该公司的成熟版本,而是一个较小、功能较弱的“实验预览”迭代,将在未来几个月在Google Gemini中进行升级。
“实际上,”Google DeepMind 首席执行官 Demis Hassabis 告诉The Verge ,“它和当前的 Pro 模型一样好。因此,您可以将其视为一个更好的整体层,以获得相同的成本效率、性能效率和速度。我们对此感到非常高兴。”
谷歌还为开发人员发布了该模型的轻量级版本,称为 Gemini 2.0 Flash。
随着功能更强大的 Gemini 模型的发布,谷歌推进了其人工智能代理议程,该议程将看到更小的、专门构建的模型代表用户采取自主行动。 Gemini 2.o 预计将显着推动谷歌推出Project Astra的努力,该项目将 Gemini Live 的对话功能与实时视频和图像分析相结合,通过智能眼镜界面为用户提供有关周围环境的信息。
谷歌周三还宣布发布Project Mariner ,这是该公司对Anthropic 计算机控制功能的回应。这个 Chrome 扩展程序能够像人类用户一样控制桌面计算机,包括击键和鼠标点击。该公司还推出了一款名为 Jules 的人工智能编码助手,可以帮助开发人员查找和改进笨重的代码,以及“深度研究”功能,可以针对您在互联网上搜索的主题生成详细报告。
Deep Research 似乎与 Perplextiy AI 和 ChatGPT Search 具有相同的功能,目前可供英语 Gemini Advanced 订阅者使用。该系统的工作原理是首先生成一个“多步骤研究计划”,在实施之前将其提交给用户批准。
一旦你签署了计划,研究代理就会对给定的主题进行搜索,然后跳入它发现的任何相关的兔子洞。一旦完成搜索,人工智能将重新生成一份关于其发现内容的报告,包括关键发现和找到信息的引用链接。您可以从 Gemini 主页顶部聊天机器人的下拉模型选择菜单中进行选择。