准确的 ChatGPT 水印工具可能存在,但 OpenAI 不会发布它

百科全书中手机上的 chatGPT
尚塔努·库马尔 / Pexels

ChatGPT抄袭者要小心,因为 OpenAI 开发了一种工具,能够检测GPT-4的书写输出,据报道准确率达到 99.99%。然而, 该公司花了一年多的时间犹豫是否要向公众发布它。

TechCrunch报道,该公司正在采取“深思熟虑的方法”,因为“所涉及的复杂性及其可能对 OpenAI 之外更广泛的生态系统产生影响”。 OpenAI 发言人表示:“我们正在开发的文本水印方法在技术上很有前途,但我们在研究替代方案时正在权衡重大风险,包括容易被不良行为者规避,以及对非英语国家等群体产生不成比例影响的可能性。”说。

文本水印系统的工作原理是将特定模式合并到模型的书面输出中,OpenAI 工具可以检测到该模式,但最终用户看不到该模式。虽然该工具可以可靠地发现其自己的 GPT-4 引擎生成的写入,但它无法检测 Gemini 或 Claude 等其他模型的输出。更重要的是,可以通过谷歌翻译运行文本输出,将其转换为另一种语言,然后再转换回来,从而删除水印本身。

这并不是 OpenAI 第一次尝试构建文本检测工具。去年, 它悄悄砍掉了正在开发的类似文本检测器,因为该工具的检测率微不足道,并且容易出现误报。该检测器于 2023 年 1 月发布,需要用户手动输入长度至少 1,000 个字符的示例文本,然后才能做出确定。它成功地对人工智能生成的内容进行了正确分类,准确率仅为 26%,并将人类生成的内容标记为人工智能衍生的内容的概率为 9%。它还导致德克萨斯 A&M 的一位教授因据称在期末作业中使用 ChatGPT 而错误地导致整个班级不及格

据报道,由于担心用户强烈反对,OpenAI 也不愿发布该工具。据《华尔街日报》报道,69% 的 ChatGPT 用户认为这种工具不可靠,并可能导致虚假的作弊指控。另外 30% 的受访者表示,如果 OpenAI 真正推出该功能,他们愿意放弃聊天机器人,转而选择其他模型。该公司还担心开发人员能够对水印进行逆向工程并构建工具来消除它。

尽管 OpenAI 还在争论发布其水印系统的优点,但其他人工智能初创公司却在争先恐后地发布自己的文本检测器,包括 GPTZero、ZeroGPT、Scribbr 和 Writer AI Content Detector。然而, 由于普遍缺乏准确性,人眼仍然是我们发现人工智能生成内容的最佳方法,这并不令人放心。


Posted

in

by

Tags: