就改变世界的技术而言, ChatGPT在推出的短时间内确实对人们的写作和编码方式产生了巨大影响。对于许多对自己的写作技巧没有信心或希望节省时间的人来说,能够插入提示并输出一串几乎足够好的文本是一个诱人的主张。然而,这种能力也有一个显着的缺点,特别是在教育领域,学生很容易在自己的论文或考试中使用 ChatGPT 。这使得他们无法尽可能多地学习,这让教师在检测人工智能的使用时遇到了全新的难题。
教师和其他用户现在正在寻找检测学生作业中 ChatGPT 使用情况的方法,许多人开始转向 GPTZero 等工具,这是普林斯顿大学学生 Edward Tian 构建的 ChatGPT 检测工具。该软件可供所有人使用,因此如果您想尝试一下并了解使用 ChatGPT 编写特定文本的可能性,可以按以下方法操作。
什么是 GPTZero?
GPTZero是一款网络应用程序和服务,旨在检测文本正文是由人类还是人工智能编写的。 22岁的Tian是普林斯顿大学计算机科学专业的本科生,曾是微软软件工程实习生,是GPTZero的开发者。
GPTZero 于 2023 年 1 月 2 日通过 Tian 的推文首次宣布,作为帮助检测 AI 抄袭的工具。田指出,该分析是基于普林斯顿大学博士的研究。候选人 Sreejan Kumar 和普林斯顿自然语言处理小组的工作。
该分析基于@sreejan_kumar和@princeton_nlp正在进行的一些研究。希望我们很快就能发表一些实证性的东西。但与此同时,这是一个有趣的应用程序:)
—爱德华·田 (@edward_the6) 2023 年 1 月 3 日
GPTZero 是免费的吗?
GPTZero 是为教育工作者设计的,但任何人都可以免费使用它。情况不太可能永远如此。服务条款提到某些服务可能会收费。还提到新注册用户可以享受 30 天的免费试用。
GPTZero 不是一个开源项目,如果没有 Streamlit(一个为 Streamlit 应用程序提供免费云服务的 Python 应用程序框架)的帮助,Tian 将面临高昂的托管费用。虽然 GPTZero 的流量只是 ChatGPT 的一小部分,但就连OpenAI 也决定开始收费以抵消其成本。
尽管 Streamlit 托管是免费的,但这通常会限制此共享平台上的带宽和资源。这会限制像 GPTZero 这样的流行应用程序的使用。
Streamlit 目前正在通过增加 GPTZero 的应用程序内存和托管限额来协助 Tian。如果它继续快速增长,这种情况可能会改变。
感谢@DataChaz和@streamlit团队的其他成员慷慨地提高了 gptzero 的托管和内存:))
—爱德华·田 (@edward_the6) 2023 年 1 月 4 日
GPTZero 准确吗?
有人声称 GPTZero 可能会被愚弄。根据 Reddit 用户Smellz_Of_Elderberry的建议,我让 ChatGPT 写一个关于《老人与海》这本书的小故事,就像一个高中生一样。 GPTZero 没有被愚弄。
我又尝试了一次,用一些错误的标点符号、不正确的动词时态和其他小错误来修改文本,但 GPTZero 仍然说,“你的文本很可能完全是由人工智能编写的。”
这里的关键词是“可能”,开发者从未承诺 GPTZero 是完美的。 GPTZero 的准确性仍在评估中,但据传闻,它似乎对大多数人来说效果良好。
如果您使用 GPTZero,请务必记住可能会出现错误。当使用GPTZero检测AI或ChatGPT帮助编写文档时, 仍然需要检查工作是否有错误。
GPTZero 是如何工作的?
GPTZero 分析文本的随机性(称为困惑度)以及文本内这种随机性的均匀性(在统计学中称为突发性)。人工智能的复杂性和突发性非常一致,而人类作家却在毫无意识的情况下改变了这些特征。
这项工作尚未完成,田指出将添加更多测试以提高人工智能文本检测的准确性。特别是,隐性偏见是一个正在探索的领域,作为检测文本是否由人工智能生成的另一种方法。
我们现在仍在研究 LM 生成文本中的隐性偏差,因此希望能够添加更多测试和因素来改进模型
—爱德华·田 (@edward_the6) 2023 年 1 月 3 日
如何使用 GPTZero?
GPTZero 可在其网站上或通过应用程序编程接口 (API) 获取。要使用该网站,只需复制您想要检查的文本并将其粘贴到标有“尝试一下”的大框中即可。
还可以上传 PDF、Word 文档或文本文件,然后单击“获取结果”按钮。您还需要选中该复选框,表示您同意服务条款。
为什么我的写作被标记为 AI?
随着 ChatGPT 的兴起和 AI 检测工具的兴起,现在作家和读者都对如何判断内容是否是 AI 创建以及真正的写作是否被标记为来自 AI 产生了新的担忧。这对于学生来说尤其是一个问题,如果他们被发现使用人工智能,他们可能会面临学校或大学的后果。一些学生现在习惯性地通过 GPTZero 等检测器运行自己的原创作品,并发现它会将句子标记为人工智能编写的,即使它们不是人工智能编写的。
2024 年, 《大西洋月刊》的一位作家伊恩·博格斯特 (Ian Bogost) 描述了他通过抄袭检测软件运行自己的原创作品时发现,最初,他的作品中有 74% 被标记为抄袭,令人震惊。经过仔细检查和消除,他设法将这个数字降到零,但他花了几个小时的审查和设置调整才达到这个目标。
人工智能检测与抄袭检测类似,两者都只能反映对一篇文章是否原创且是否由人类生成的最佳猜测。这些工具需要进行大量仔细的审查,因为两者都可能产生误报。如果您发现您的作品在 GPTZero 上被标记为人工智能生成,而事实并非如此,那么这可能是出于多种原因,例如不是以英语为母语、与您的想法过于重复或使用过像语法这样的工具。
如果您的作品被标记为人工智能,请仔细检查所有引文和引文的格式是否正确,并尽量避免使用 Grammarly 等自动工具进行编辑。
我们真的需要抄袭检查吗?
OpenAI 远远超出了许多文本生成人工智能所绑定的研究实验室, 于 2022 年 11 月下旬向公众发布了 ChatGPT 。到 2023 年 1 月,ChatGPT 拥有超过 1 亿用户,使其成为迄今为止增长最快的公共应用程序。
这意味着,随着这种人工智能帮助出现在生活的各个角落,对抄袭的担忧只会增加。微软正在将 OpenAI 的技术整合到 Bing 搜索中,而谷歌正在测试自己的版本,称为 Gemini(以前称为 Bard) 。
与此相关的是,像 Dall-E和Stable Diffusion这样的人工智能图像生成器正因潜在的版权侵犯而受到审查。所有这些人工智能服务都经过了数十亿人在网上发现的文字、照片和艺术品的训练。
在某种程度上,人工智能是在借鉴人类智能,而不是自己创造。如果我向另一个人借钱,我必须给予信用,并可能支付许可费。借助生成式人工智能,引用来源变得更加困难,因为每个文本或图像都被分解为分散的元素,然后使用数千或数百万个来源重新组合以创建新的作品。
我们要么需要重新思考我们对版权和抄袭的看法,要么找到有助于识别人工智能生成材料的工具,并可能开发一种方法,向为每件人工智能生成作品做出贡献的广大人员给予认可。