Google 在I/O 2024的主要主题演讲中充满了大量新的人工智能功能,这些功能将在 Gemini 的帮助下登陆桌面和移动设备。将有新的方式通过视频和多模式提示请求来搜索谷歌,而智能手机最终将通过Project Astra的摄像头获得人工智能超能力。
但有一个功能确实让我印象深刻:在 Google 相册中 询问 Gemini 的照片。
首先,什么是双子座?
首先,什么是双子座?它基本上是 Google 的 AI 模型系列,包括 Gemini Nano、Gemini Pro 和 Gemini Ultra。简而言之,它是 Google 版本的 OpenAI 及其自己的 GPT 模型,例如ChatGPT 。
Gemini 可以像其他大型语言模型 (LLM) 一样理解和生成文本,例如 OpenAI 的 GPT。然而,Gemini 可以做得更多——它理解、操作和组合其他形式的信息,如图像、视频、音频,甚至代码。
对于Android 智能手机,它使用Gemini Nano ,它在设备本身上本地运行。得益于Gemini Nano 模型, Circle to Search等现有功能将变得更好,能够帮助学生完成物理和数学作业。
它还将更加了解当前屏幕上的内容,因为您将能够向 Gemini 询问有关您正在观看的视频或正在浏览的长 PDF 的问题,而不是滚动数十页。 Gemini Nano 甚至将为您的智能手机带来多模式功能,例如将多个请求合而为一的搜索查询。
使用 Gemini 询问照片是 I/O 2024 上宣布的众多 Gemini 新功能之一,并将于今年晚些时候出现在 Google Photos 中。长话短说,您可以使用更具对话性的方法而不是关键字来搜索庞大的照片库。
在 Google I/O 演示中,Google 展示了你可以直接问“我的车牌是什么?”或者“我女儿什么时候学会游泳的?”提出满足这些要求的照片。
它甚至更进一步提出诸如“告诉我我女儿的游泳进展如何”之类的要求。像这样的查询会让双子座根据日期和背景回顾您的照片以获得合适的结果。
当《Ask Photos with Gemini》在舞台上展示时,我很兴奋,迫不及待地想拿到手。
家长的人工智能伴侣
我当妈妈才两年多一点。但那段时间,我拍的照片比以往任何时候都多,因为我喜欢捕捉女儿的所有小瞬间,无论是她可爱又傻气,还是我想在照片或视频中捕捉到的那些重要的里程碑。带着 1TB iPhone 15 Pro和我测试过的无数 Android 手机,我总是给我女儿拍照。
你可能认为这太过分了——也许确实如此。但我没有太多父母给我的童年照片,更不用说视频了。他们并没有真正捕捉到我所有的特殊时刻,我只有模糊的记忆,没有什么超级详细或具体的。凭借我们现在拥有的所有技术,它帮助我确保我的女儿拥有她童年的视觉证据。
虽然我确实会拍摄照片和视频与家人和选定的朋友分享,但我主要捕捉这些时刻,因为我想稍后回顾它们。无论我只是想快速提神,让自己脸上露出微笑,还是当我是一位年迈的老太太,需要沿着记忆的小巷漫步时,我都会大量浏览我的视觉记忆。
通过“与双子座询问照片”,我迫不及待地想让它向我展示我女儿在各种生活事件中的进展。例如,我们今年八月让她开始上学前班。我很想请双子座向我展示她在整个学校的进步,或者只是向我展示她每个学年的所有“第一天”。或者当她学习骑自行车时,我可以看到她从辅助轮过渡到完全骑自行车的进步。哎呀,双子座甚至可以告诉我每年我女儿吹灭生日蛋糕上的蜡烛的时间。
对我来说,利用“Ask Photos”有很多可能性,但这些只是我想到的一些想法。虽然这对父母来说对于孩子的里程碑很有好处,但对于其他事情也有好处。我可以想象自己用它来庆祝我的周年纪念日、节日,甚至我的宠物。
当然,我现在可以浏览所有照片并使用面孔和关键字进行搜索。但与 Gemini 一起询问照片似乎是一种更简单、更快速、更自然的方式。当您拥有包含超过 50,000 张照片和视频的照片库时,我可以使用更简单的方法来搜索它。
我迫不及待地想使用这个
Ask Photos 并不是 Google 在 Google I/O 2024 上展示的唯一 Gemini AI 功能。虽然它因其实用性而成为我最兴奋的功能,但我也想看看其他令人兴奋的功能。
例如,阿斯特拉计划似乎很有趣。我经常用手机拍摄一些我想要保存以供日后使用并了解更多信息的照片,例如植物和花卉。但有了 Astra,你就可以在相机中享受人工智能的好处,它可以实时告诉你你正在看什么。尽管谷歌没有宣布推出任何智能眼镜,但 Astra 项目表明,在某个时候,这将是智能眼镜中一项令人难以置信的功能。
我也非常渴望查看由 Gemini 提供支持的 Google 搜索中的多模式提示请求。我不是那种喜欢计划任何事情的人,所以如果谷歌可以为我做一些跑腿的工作,那么我就全力以赴。虽然我不认为实时诈骗警报对我来说非常有用(反正我从来不接电话),但对于其他人来说,这将是一个非常有用的功能。
“用 Gemini 询问照片”应该会在今年夏天晚些时候进入 Google 照片,我迫不及待地想尝试一下。