ArXiv 划红线论文含 AI 痕迹封号一年 - News

「Here is a 200 word summary; would you like me to make any changes?」这种话留在论文正文里，居然能上传到 arXiv——你以为我在开玩笑？arXiv 这周刚动手处理的就是这种稿子。

新规则很直接：从现在开始，谁的论文里被发现「明显没检查 AI 输出」的痕迹，直接封禁一年。一年之后想再投，还得先把这篇稿子拿到一个像样的同行评审期刊上发出来。

触发封禁的三类痕迹

arXiv 的 moderator Thomas Dietterich 在政策声明里把判定标准写得很死：

幻觉引用——文中标注的论文/作者根本不存在
LLM 残留 meta 评论——比如那句被无数人转发的「Here is a 200 word summary; would you like me to make any changes?」，或者「the data in this table is illustrative, fill it in with the real numbers from your experiments」
明显抄袭、有偏见、错误明显，且能看出是直接从 AI 复制过来的内容

Dietterich 说得很白：

「if a submission contains incontrovertible evidence that the authors did not check the results of LLM generation, this means we can’t trust anything in the paper.」

讲人话就是——你连 AI 给你写的东西都懒得看一眼就交了，那这篇里的任何一个数据、任何一个结论我都不能信。

为什么这周动手

直接原因是一组很扎眼的数字。arXiv 自己统计：

年份	幻觉引用出现率
2023	1 / 2,828 篇
2026 年初	1 / 277 篇

三年涨了 10 倍。

更让学术圈坐不住的是 NeurIPS 2025 那批稿子——GPTZero 在 4,841 篇已经通过三位以上人类审稿人评审的论文里，扫出了 100+ 条幻觉引用，分散在 53 篇论文里。

也就是说，AI 假引用不只是混进了 arXiv 这种预印本仓库，它已经穿过了顶级会议的同行评审。三个人看完都没发现。

这不是禁 AI，是禁「不检查」

政策里有个细节值得注意：arXiv 没有禁止作者用 LLM。他们禁的是「不检查就提交」。

「作者对全部内容负责，不管这些内容是怎么生成的。」——这是 arXiv 的原话。

换言之，你可以用 ChatGPT 帮你润色语言、可以让 Claude 帮你列大纲、可以让 GPT-5.5 帮你写第一稿。但你得自己读一遍、自己核每一个引用、自己把 LLM 留下的那些「需要您填入真实数据」的占位符删干净。

这其实是把责任压回作者身上，是个挺合理的判断方法——AI 工具本身没罪，懒得检查的人有罪。

「一击即封」+ 申诉机制

执行流程是这样的：

moderator 标记可疑稿件
学科 chair（计算机科学是单独一个 chair）确认
作者被封一年
一年后想再投，必须先在正经同行评审期刊上发表过一篇——证明你的稿子能过真正的审稿
作者可以申诉

这套机制的狠点在第 4 条——封禁结束不等于自动解封。arXiv 等于是说，你如果想回来，得先证明自己能写出过得了同行评审的东西。

学术圈反应

这事在 Hacker News 上吵了两天，主流的两种反应：

支持派说：终于有人管了。AI 假引用泛滥已经到了「读论文要先 Google 核每一篇参考文献」的地步，再不出手，arXiv 的可信度就会被冲垮。

反对派说：判定标准太模糊。「明显没检查」这种说法留下太多自由裁量空间，moderator 一封人就是一年，没有清晰的边界，容易误伤。

还有一种声音可能更值得关注：这条规则不会让 AI 学术造假消失，只会让会用 AI 的人学会更仔细地清理痕迹。NeurIPS 2025 那 53 篇能过三人审稿，本来就已经说明 AI 痕迹是可以擦干净的。arXiv 抓的是技术粗糙的，没办法抓技术熟练的。

这是个开端，不是结尾

arXiv 是第一个公开划线的学术平台。接下来要看：

NeurIPS、ICML、CVPR 这些顶级会议会不会跟进
期刊出版商（Springer、Elsevier、IEEE）什么时候出对应政策
大学的博士论文标准会不会改

学术圈处理 AI 的姿态一直很矛盾——一边鼓励大家用 AI 提效，一边对 AI 写出来的东西心存芥蒂。arXiv 这次至少把「最起码的下限」明确了：你要用，自己负责。不负责，禁言一年。

至于这条线能挡住多少人，6 个月之后看下一组数据。

参考来源：CocoLoop、Research repository ArXiv will ban authors for a year if they let AI do all the work（TechCrunch）；ArXiv to Ban Researchers for a Year if They Submit AI Slop（404 Media）；ArXiv Will Ban Authors One Year for Unchecked LLM Output（WinBuzzer）