GPTZero：如何使用ChatGPT检测工具

就改变世界的技术而言， ChatGPT在推出的短时间内确实对人们的写作和编码方式产生了巨大影响。对于许多对自己的写作技巧没有信心或希望节省时间的人来说，能够插入提示并输出一串几乎足够好的文本是一个诱人的主张。然而，这种能力也有一个显着的缺点，特别是在教育领域，学生很容易在自己的论文或考试中使用 ChatGPT 。这使得他们无法尽可能多地学习，这让教师在检测人工智能的使用时遇到了全新的难题。

教师和其他用户现在正在寻找检测学生作业中 ChatGPT 使用情况的方法，许多人开始转向 GPTZero 等工具，这是普林斯顿大学学生 Edward Tian 构建的 ChatGPT 检测工具。该软件可供所有人使用，因此如果您想尝试一下并了解使用 ChatGPT 编写特定文本的可能性，可以按以下方法操作。

什么是 GPTZero？

GPTZero是一款网络应用程序和服务，旨在检测文本正文是由人类还是人工智能编写的。 22岁的Tian是普林斯顿大学计算机科学专业的本科生，曾是微软软件工程实习生，是GPTZero的开发者。

GPTZero 于 2023 年 1 月 2 日通过 Tian 的推文首次宣布，作为帮助检测 AI 抄袭的工具。田指出，该分析是基于普林斯顿大学博士的研究。候选人 Sreejan Kumar 和普林斯顿自然语言处理小组的工作。

该分析基于@sreejan_kumar和@princeton_nlp正在进行的一些研究。希望我们很快就能发表一些实证性的东西。但与此同时，这是一个有趣的应用程序:)
—爱德华·田 (@edward_the6) 2023 年 1 月 3 日

GPTZero 是免费的吗？

GPTZero 是为教育工作者设计的，但任何人都可以免费使用它。情况不太可能永远如此。服务条款提到某些服务可能会收费。还提到新注册用户可以享受 30 天的免费试用。

GPTZero 不是一个开源项目，如果没有 Streamlit（一个为 Streamlit 应用程序提供免费云服务的 Python 应用程序框架）的帮助，Tian 将面临高昂的托管费用。虽然 GPTZero 的流量只是 ChatGPT 的一小部分，但就连OpenAI 也决定开始收费以抵消其成本。

尽管 Streamlit 托管是免费的，但这通常会限制此共享平台上的带宽和资源。这会限制像 GPTZero 这样的流行应用程序的使用。

Streamlit 目前正在通过增加 GPTZero 的应用程序内存和托管限额来协助 Tian。如果它继续快速增长，这种情况可能会改变。

感谢@DataChaz和@streamlit团队的其他成员慷慨地提高了 gptzero 的托管和内存:))
—爱德华·田 (@edward_the6) 2023 年 1 月 4 日

GPTZero 准确吗？

有人声称 GPTZero 可能会被愚弄。根据 Reddit 用户Smellz_Of_Elderberry的建议，我让 ChatGPT 写一个关于《老人与海》这本书的小故事，就像一个高中生一样。 GPTZero 没有被愚弄。

我又尝试了一次，用一些错误的标点符号、不正确的动词时态和其他小错误来修改文本，但 GPTZero 仍然说，“你的文本很可能完全是由人工智能编写的。”

这里的关键词是“可能”，开发者从未承诺 GPTZero 是完美的。 GPTZero 的准确性仍在评估中，但据传闻，它似乎对大多数人来说效果良好。

如果您使用 GPTZero，请务必记住可能会出现错误。当使用GPTZero检测AI或ChatGPT帮助编写文档时，仍然需要检查工作是否有错误。

GPTZero 是如何工作的？

GTPZero的AI文本评估包括困惑度和突发度的统计。 — 图片经版权所有者许可使用

GPTZero 分析文本的随机性（称为困惑度）以及文本内这种随机性的均匀性（在统计学中称为突发性）。人工智能的复杂性和突发性非常一致，而人类作家却在毫无意识的情况下改变了这些特征。

这项工作尚未完成，田指出将添加更多测试以提高人工智能文本检测的准确性。特别是，隐性偏见是一个正在探索的领域，作为检测文本是否由人工智能生成的另一种方法。

我们现在仍在研究 LM 生成文本中的隐性偏差，因此希望能够添加更多测试和因素来改进模型
—爱德华·田 (@edward_the6) 2023 年 1 月 3 日

如何使用 GPTZero？

GPTZero 可在其网站上或通过应用程序编程接口 (API) 获取。要使用该网站，只需复制您想要检查的文本并将其粘贴到标有“尝试一下”的大框中即可。

GPTZero 的网站非常简单，只有一个文本框和一个提交按钮。 — 图片经版权所有者许可使用

还可以上传 PDF、Word 文档或文本文件，然后单击“获取结果”按钮。您还需要选中该复选框，表示您同意服务条款。

为什么我的写作被标记为 AI？

随着 ChatGPT 的兴起和 AI 检测工具的兴起，现在作家和读者都对如何判断内容是否是 AI 创建以及真正的写作是否被标记为来自 AI 产生了新的担忧。这对于学生来说尤其是一个问题，如果他们被发现使用人工智能，他们可能会面临学校或大学的后果。一些学生现在习惯性地通过 GPTZero 等检测器运行自己的原创作品，并发现它会将句子标记为人工智能编写的，即使它们不是人工智能编写的。

2024 年， 《大西洋月刊》的一位作家伊恩·博格斯特 (Ian Bogost) 描述了他通过抄袭检测软件运行自己的原创作品时发现，最初，他的作品中有 74% 被标记为抄袭，令人震惊。经过仔细检查和消除，他设法将这个数字降到零，但他花了几个小时的审查和设置调整才达到这个目标。

人工智能检测与抄袭检测类似，两者都只能反映对一篇文章是否原创且是否由人类生成的最佳猜测。这些工具需要进行大量仔细的审查，因为两者都可能产生误报。如果您发现您的作品在 GPTZero 上被标记为人工智能生成，而事实并非如此，那么这可能是出于多种原因，例如不是以英语为母语、与您的想法过于重复或使用过像语法这样的工具。

如果您的作品被标记为人工智能，请仔细检查所有引文和引文的格式是否正确，并尽量避免使用 Grammarly 等自动工具进行编辑。

我们真的需要抄袭检查吗？

OpenAI 远远超出了许多文本生成人工智能所绑定的研究实验室，于 2022 年 11 月下旬向公众发布了 ChatGPT 。到 2023 年 1 月，ChatGPT 拥有超过 1 亿用户，使其成为迄今为止增长最快的公共应用程序。

这意味着，随着这种人工智能帮助出现在生活的各个角落，对抄袭的担忧只会增加。微软正在将 OpenAI 的技术整合到 Bing 搜索中，而谷歌正在测试自己的版本，称为 Gemini（以前称为 Bard）。

与此相关的是，像 Dall-E和Stable Diffusion这样的人工智能图像生成器正因潜在的版权侵犯而受到审查。所有这些人工智能服务都经过了数十亿人在网上发现的文字、照片和艺术品的训练。

在某种程度上，人工智能是在借鉴人类智能，而不是自己创造。如果我向另一个人借钱，我必须给予信用，并可能支付许可费。借助生成式人工智能，引用来源变得更加困难，因为每个文本或图像都被分解为分散的元素，然后使用数千或数百万个来源重新组合以创建新的作品。

我们要么需要重新思考我们对版权和抄袭的看法，要么找到有助于识别人工智能生成材料的工具，并可能开发一种方法，向为每件人工智能生成作品做出贡献的广大人员给予认可。