ChatGPT「克星」来了！文章作者是人是AI几秒检出，华人小哥元旦假期搞定，服务器已挤爆

王林

发布时间：2023-04-12 08:49:24

2577人浏览过

来源于51CTO.COM

转载

你说ChatGPT，它写的东西逼真到傻傻分不清？

没关系！

现在，它的“克星”来了——

一位华人小哥专门搞了这么一个网站，专门鉴别文字到底是出自于AI还是人类。

你只需要把相应的内容粘进去，几秒内就能分析出结果。

它：“就知道是AI。”

如此神器一出，可谓迅速俘获大家的芳心。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

这不，直接把服务器都给挤崩喽（好在还有个备用的）。

这下，那些用ChatGPT写作业的“熊孩子”也要惨啦？

是人还是ChatGPT？GPTZero：看我的

这个网站名叫GPTZero。

它主要靠“perplexity”，即文本的“困惑度”作为指标来判断所给内容到底是谁写的。

NLP领域的朋友们都知道，这个指标就是用来评价一个语言模型的好坏的。

在这里，每当你喂给GPTZero一段测试内容，它就会分别计算出：

1、文字总困惑度

这个值越高，就越可能出自人类之手。

2、所有句子的平均困惑度

句子越长，这个值通常就越低。

3、每个句子的困惑度

通过条形图的方式呈现，鼠标悬浮到各个方块就可以查看相应的句子是什么（这里就两块，因为我此时输入的测试内容就俩句子）。

之所以要绘制这样的条形图，作者也作出了解释：

根据最新的一些研究：人类书写的一些句子可能具有较低的困惑度（前面说过，人类的困惑度是比较高的），但随着继续写，困惑度势必会出现峰值。

相反，用机器生成的文本，其困惑度是均匀分布的，并且总是很低。

除此之外，GPTZero还会挑出困惑度最高的那个句子（也就是最像人写的）：

规则就是这些，接下来实际测一测。

测试1：成功

首先来一段最新的英文新闻（目前还不支持测中文）：

将它粘贴进测试框（需注意每句至少5个单词，建议每段能有10个句子，结果会更准一些）。

很快，GPTZero计算出这段文字的总文字困惑度为27，句子平均困惑度为171.2，每条句子的困惑度图长这样：

以及困惑度最高的句子的值为476。

看这个结果，估计你也猜出了GPTZero的答案：

是人类写的。

答对了。

测试2：失败

来一段ChatGPT的。

将内容粘贴进测试框，得出这段文字的总文字困惑度为31，句子平均困惑度为76.67，每条句子的困惑度图长这样：

以及困惑度最高的句子的值为99。

看起来，每项困惑度值都和上面那段差距都挺大的，应该能猜出来是AI写的吧。

不过遗憾的是，GPTZero无法给出答案，还希望我们再多加一点文字试试。

显然，这段话字数够多，但句子不够多，无法让GPTZero一眼识破ChatGPT的“伪装”。

测试3：成功

那我们再来一段ChatGPT的试试。

这回内容够长，句子也够多。

果然没问题了，GPTZero直接答对：

好像确实摸出来一点门道：

靠岸学术

一款集翻译，阅读，文献管理于一体的英文文献阅读器

下载

那就是字多的同时，句子数量也一定要多，至少5句，好让GPTZero通过直方图的分布加码识别，最后的准确率就可以提高一些。

另外还需要提的是，我们发现在挑战失败的情况中，除了上面这种识别不出来的时候，也有直接识别错误的——

比如把AI写的判断成人写的：

把人写的新闻判断成AI的：

这种情况按照上面所说的窍门，再多加点内容可能就能将结果扳回来。

（注意是可能哈，就上面这段新闻，我们把所有内容都粘进去了，它也说不行，还说要再多来点。）

普林斯顿华人小哥出品

创建该网站的，是一个22岁的华人小哥Edward Tian，来自加拿大多伦多。

目前是美国普林斯顿CS专业大四学生，辅修认知科学和新闻学，对软件工程、机器学习等有浓厚的兴趣。

他现在微软实习，曾在BBC、贝灵猫等公司撰写过科技稿件，还曾加入到地图工具Representable的创始团队。

学习期间，他曾来到清华大学参加为期四周的城市研究研讨会。

据他表示，这个应用程序是新年假期在咖啡店完成的。

之所以想要开发这款应用程序，简而言之就是因为有太多ChatGPT炒作，人类应该知道有哪些是AI写的文章。

目前仍处于准系统阶段，预计在接下来几周内改进模型和分析。

除此之外，他还透露，正在测试由学生撰写的新闻文章数据集，并希望最终能发表论文。

更多ChatGPT杀手

事实上，也不只有这位小哥看ChatGPT不顺眼了。还有其他人类组织也相应开发了AI文本检测器，AKA ChatGPT杀手。

大体思路也都差不多，那就是“用魔法打败魔法”，用AI写的东西来训练新AI。

前阵子，OpenAI自己联合哈佛等高校机构联合打造了一款检测器：GPT-2 Output Detector。

作者们先是发布了一个“GPT-2生成内容”和WebText（专门从国外贴吧Reddit上扒下来的）数据集，让AI理解“AI语言”和“人话”之间的差异。

随后，用这个数据集对RoBERTa模型进行微调，就得到了这个AI检测器。其中人话一律被识别为True，AI生成的内容则一律被识别为Fake。

（RoBERTa是BERT的改进版。原始的BERT使用了13GB大小的数据集，但RoBERTa使用了包含6300万条英文新闻的160GB数据集。）

另一位早年代表选手，也因为这次新进展再次被提及。

它就是MIT-IBM沃森AI实验室的以及哈佛NLP实验室开发的GLTR模型。

它主要通过对文本进行统计分析和可视化，而用来检测的是最初用来生成文本的相同or类似模型。目前主要支持GPT-2和BERT两个模型。

由于输出是模型知道的所有单词排名，根据排名对文本每个单词进行颜色编码，前10名是绿色，前100名是黄色，前1000名是红色，紫色则是不太可能出现的词。

如果一段文本黄绿色过多，那么这段文字主要是由AI生成的。

此番GPTZero再度亮相，不少网友惊叹：Incredible work！

但也有人表示，文本检测器根本就是一场失败的军备竞赛，他们的实际效果并不好。也阻挡不了ChatGPT的发展。

与此同时，还有网友探讨起关于「文章是否需要明确指示由AI还是人类编写」的必要性。

有位词曲创作者认为，这是有必要的，就像在看杂志时会标注“广告”，这应该是一个简单的要求。

但有网友立即表示反对，为什么要设置障碍？这就跟使用PS然后加上Adobe水印，对产品没有任何益处。

对于这个问题，你怎么看呢？

试玩链接：

https://etedward-gptzero-main-zqgfwb.streamlit.app/

参考链接：

[1]https://brackets.substack.com/about

[2]https://www.reddit.com/r/programming/comments/102hxlg/gptzero_an_app_to_efficiently_tell_if_an_essay_is/

[3]https://twitter.com/Marc__Watkins/status/1601746409203863553

[4]http://gltr.io/

QClaw怎么打开浏览器_QClaw调用浏览器技能与网址自动跳转【教程】

workbuddy多服务器部署_workbuddy多机部署技巧【技巧】

workbuddy日志查看教程_workbuddy日志操作技巧【技巧】

openclaw如何重置密码 openclaw找回密码详细操作步骤【指南】

openclaw支持哪些系统 openclaw兼容设备与运行环境说明

相关专题

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开，深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例，帮助开发者掌握 Python 在高并发场景中的高效开发方法，并提升系统资源利用率与整体运行性能。

2026.03.12

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

178

2026.03.11

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开，重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析，帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系，提升团队协作效率与项目迭代速度。

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

102

2026.03.06

Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开，深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例，分析内存安全保障原理与零成本抽象优势，并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学，掌握在高性能与安全性并重场景中的工程实践能力。

227

2026.03.05

PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开，重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景，深入分析性能瓶颈定位与优化思路，帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

532

2026.03.04