
谷歌对其隐私政策的最新更新将使该公司能够自由地在网络上抓取任何有利于构建和改进其人工智能工具的内容。
谷歌新政策称:“谷歌利用信息来改进我们的服务,并开发新产品、功能和技术,使我们的用户和公众受益。” “例如,我们使用公开信息来帮助训练 Google 的 AI 模型并构建 Google Translate、 Bard和 Cloud AI 功能等产品和功能。”
Gizmodo指出,该政策已更新为“人工智能模型”,而之前的说法是“针对语言模型”。此外,该政策还添加了 Bard 和 Cloud AI,而之前它只提到了 Google Translate,并为其收集了数据。
周末更新的隐私政策显得尤其不祥,因为它表明您在线产生的任何信息都可供谷歌用于训练其人工智能模型。
上述措辞似乎不仅以某种方式描述了谷歌生态系统中的内容,而且还以这样一种方式进行了详细说明,即该品牌可以从网络的任何部分访问信息。
围绕人工智能大规模发展的主要问题是隐私、抄袭以及人工智能能否消除正确信息等问题。 ChatGPT 等聊天机器人的早期版本基于大型语言模型 (LLM),该模型使用公共资源(例如常见的爬行网络存档、WebText2、Books1、Books2 和 Wikipedia)作为训练数据。
早期的 ChatGPT 因卡在 2021 年之后的信息上并随后用虚假数据填充响应而臭名昭著。这可能是谷歌希望不受限制地访问网络数据以使 Bard 等工具受益的原因之一,以便对其人工智能模型进行现实世界和潜在的实时训练。
Gizmodo 还指出,谷歌可以利用这项新政策来收集旧的但仍然是人类生成的内容,例如长期被遗忘的评论或博客文章,以便仍然了解人类文本和语音是如何开发和分发的。尽管如此,谷歌将如何使用其收集的数据仍有待观察。
随着人工智能聊天机器人的流行,包括 Twitter 和 Reddit 在内的一些社交媒体平台作为最新信息的主要来源,已经限制了它们的公众访问,这让整个社区感到懊恼。
这两个平台都关闭了对其 API 的免费访问,这限制用户以保护知识产权为幌子下载大量帖子以在其他地方共享。相反,这破坏了许多使 Twitter 和 Reddit 顺利运行的第三方工具。
Twitter 和 Reddit 都不得不应对其他挫折和争议,因为它们的所有者对人工智能接管的担忧加剧。