「Here is a 200 word summary; would you like me to make any changes?」这种话留在论文正文里,居然能上传到 arXiv——你以为我在开玩笑?arXiv 这周刚动手处理的就是这种稿子。
新规则很直接:从现在开始,谁的论文里被发现「明显没检查 AI 输出」的痕迹,直接封禁一年。一年之后想再投,还得先把这篇稿子拿到一个像样的同行评审期刊上发出来。
触发封禁的三类痕迹
arXiv 的 moderator Thomas Dietterich 在政策声明里把判定标准写得很死:
- 幻觉引用——文中标注的论文/作者根本不存在
- LLM 残留 meta 评论——比如那句被无数人转发的「Here is a 200 word summary; would you like me to make any changes?」,或者「the data in this table is illustrative, fill it in with the real numbers from your experiments」
- 明显抄袭、有偏见、错误明显,且能看出是直接从 AI 复制过来的内容
Dietterich 说得很白:
「if a submission contains incontrovertible evidence that the authors did not check the results of LLM generation, this means we can’t trust anything in the paper.」
讲人话就是——你连 AI 给你写的东西都懒得看一眼就交了,那这篇里的任何一个数据、任何一个结论我都不能信。
为什么这周动手
直接原因是一组很扎眼的数字。arXiv 自己统计:
| 年份 | 幻觉引用出现率 |
|---|---|
| 2023 | 1 / 2,828 篇 |
| 2026 年初 | 1 / 277 篇 |
三年涨了 10 倍。
更让学术圈坐不住的是 NeurIPS 2025 那批稿子——GPTZero 在 4,841 篇已经通过三位以上人类审稿人评审的论文里,扫出了 100+ 条幻觉引用,分散在 53 篇论文里。
也就是说,AI 假引用不只是混进了 arXiv 这种预印本仓库,它已经穿过了顶级会议的同行评审。三个人看完都没发现。
这不是禁 AI,是禁「不检查」
政策里有个细节值得注意:arXiv 没有禁止作者用 LLM。他们禁的是「不检查就提交」。
「作者对全部内容负责,不管这些内容是怎么生成的。」——这是 arXiv 的原话。
换言之,你可以用 ChatGPT 帮你润色语言、可以让 Claude 帮你列大纲、可以让 GPT-5.5 帮你写第一稿。但你得自己读一遍、自己核每一个引用、自己把 LLM 留下的那些「需要您填入真实数据」的占位符删干净。
这其实是把责任压回作者身上,是个挺合理的判断方法——AI 工具本身没罪,懒得检查的人有罪。
「一击即封」+ 申诉机制
执行流程是这样的:
- moderator 标记可疑稿件
- 学科 chair(计算机科学是单独一个 chair)确认
- 作者被封一年
- 一年后想再投,必须先在正经同行评审期刊上发表过一篇——证明你的稿子能过真正的审稿
- 作者可以申诉
这套机制的狠点在第 4 条——封禁结束不等于自动解封。arXiv 等于是说,你如果想回来,得先证明自己能写出过得了同行评审的东西。
学术圈反应
这事在 Hacker News 上吵了两天,主流的两种反应:
支持派说:终于有人管了。AI 假引用泛滥已经到了「读论文要先 Google 核每一篇参考文献」的地步,再不出手,arXiv 的可信度就会被冲垮。
反对派说:判定标准太模糊。「明显没检查」这种说法留下太多自由裁量空间,moderator 一封人就是一年,没有清晰的边界,容易误伤。
还有一种声音可能更值得关注:这条规则不会让 AI 学术造假消失,只会让会用 AI 的人学会更仔细地清理痕迹。NeurIPS 2025 那 53 篇能过三人审稿,本来就已经说明 AI 痕迹是可以擦干净的。arXiv 抓的是技术粗糙的,没办法抓技术熟练的。
这是个开端,不是结尾
arXiv 是第一个公开划线的学术平台。接下来要看:
- NeurIPS、ICML、CVPR 这些顶级会议会不会跟进
- 期刊出版商(Springer、Elsevier、IEEE)什么时候出对应政策
- 大学的博士论文标准会不会改
学术圈处理 AI 的姿态一直很矛盾——一边鼓励大家用 AI 提效,一边对 AI 写出来的东西心存芥蒂。arXiv 这次至少把「最起码的下限」明确了:你要用,自己负责。不负责,禁言一年。
至于这条线能挡住多少人,6 个月之后看下一组数据。
参考来源:Research repository ArXiv will ban authors for a year if they let AI do all the work(TechCrunch);ArXiv to Ban Researchers for a Year if They Submit AI Slop(404 Media);ArXiv Will Ban Authors One Year for Unchecked LLM Output(WinBuzzer)