谷歌的人工智能检测工具现已可供任何人尝试

周三,谷歌 通过 X(以前的 Twitter)上的帖子宣布,SynthID 现在可供任何想要尝试的人使用。人工智能生成内容的认证系统将难以察觉的水印嵌入到生成的图像、视频和文本中,使用户能够验证一段内容是由人类还是机器制作的。

“我们正在开源 SynthID Text 水印工具,”该公司写道。 “它将免费向开发者和企业提供,这将帮助他们识别人工智能生成的内容。”

SynthID 于 2023 年首次亮相,作为一种为 AI 生成的图像、音频和视频添加水印的方法。它最初被集成到 Imagen 中,该公司随后在今年 5 月的 I/O 2024 上宣布将其集成到 Gemini 聊天机器人中

该系统的工作原理是对令牌进行编码——这些令牌是基本数据块(无论是单个字符、单词还是短语的一部分),生成式人工智能使用这些数据块来理解提示并预测其回复中的下一个单词——带有难以察觉的水印在文本生成过程中。据DeepMind 5 月份的一篇博客称,它是通过“通过调节生成代币的可能性,在生成时的代币分布中引入附加信息”来实现这一点的。

通过将模型的单词选择及其“调整后的概率分数”与带水印和无水印文本的预期分数模式进行比较,SynthID 可以检测人工智能是否写了该句子。

根据周三发表在《自然》杂志上的一项研究,这个过程不会影响响应的准确性、质量或速度,也不能轻易绕过。与可以轻松剥离和擦除的标准元数据不同,据报道,即使内容被裁剪、编辑或以其他方式修改, SynthID 的水印仍然保留。

马里兰大学副教授 Soheil Feizi 表示:“为人工智能生成的文本实现可靠且不易察觉的水印从根本上来说是一项挑战,特别是在[大型语言模型]输出接近确定性的情况下,例如事实问题或代码生成任务。” ,告诉麻省理工学院技术评论,并指出其开源性质“允许社区测试这些探测器并评估它们在不同环境中的稳健性,有助于更好地理解这些技术的局限性。”

然而,该系统并非万无一失。虽然 SynthID 具有防篡改能力,但如果文本通过语言翻译应用程序运行或经过大量重写,则可以删除 SynthID 的水印。对于短文本段落以及确定基于事实陈述的答复是否由人工智能生成而言,它的效果也较差。例如,对于“法国的首都是哪里?”这一提示只有一个正确答案。人类和人工智能都会告诉你这是巴黎。

如果您想亲自尝试 SynthID,可以从Hugging Face下载它,作为 Google 更新的Responsible GenAI Toolkit的一部分。


Posted

in

by

Tags: