OpenAI 模型攻克 Erdős 80 年数学猜想 - News

5月20号晚上，OpenAI扔了一份证明出来。

1946年Paul Erdős问过一个问题：平面上摆n个点，能有多少对点彼此距离恰好等于1？整整80年里，数学界主流的答案是——按方格排大致就接近最优，对数最多到 n^(1+o(1))——意思是几乎线性，超出线性的部分随n增大可以忽略到无穷小。

OpenAI的一个内部推理模型把这个故事改写了。

翻过了什么

模型证明了：存在一个固定的常数 δ > 0，使得至少能找到 n^(1+δ) 对单位距离。

「o(1)」和「δ > 0」这两个看着差不多，差别是天和地。前者意味着多项式之外的部分趋于零、可以忽略；后者意味着永远有一段固定大小的多项式增长摆在那儿，怎么把n推大也消不掉。

证明思路更有意思——用代数数论搭出来的。

具体说，模型把这个看起来纯几何的问题，桥接到了代数数论里的某些工具，找到了一族无穷多的反例构造。普林斯顿的Noga Alon看完之后给的评价是：

“The construction uses sophisticated tools from algebraic number theory in an elegant and clever way.”

这是数学家给同行打高分时的措辞，从Alon这种级别的人嘴里出来分量很重。

用的不是数学专用模型

这事的两个关键信号必须分清楚。

第一，不是GPT-5、不是数学专用模型，是个通用推理模型。

OpenAI没说具体型号，只说”internal model”。但他们刻意强调了这一点：跟AlphaProof那种为数学训练的专用系统不一样，这次的模型没经过专门的几何或代数数论训练，靠的是跨领域推理——拿A领域的工具去钉B领域的钉子。

第二，这次靠谱。

2025年10月OpenAI第一次宣称自家模型解了某道数学开放题，三天后被数学家Thomas Bloom挑出bug，全网刷屏的”突破”灰溜溜撤回。这次OpenAI做了件挺解释成本的事——把Bloom自己请进了独立验证名单。

陪审团一共9个人，包括：

Tim Gowers（Fields奖得主）
Noga Alon（普林斯顿）
Thomas Bloom（去年的”挑错人”）
Daniel Litt
Arul Shankar
Jacob Tsimerman
Melanie Matchett Wood

九个人审完，联名出了一份companion paper给证明背书。

Gowers给的定调最直接：

“A milestone in AI mathematics, worthy of journal publication.”

「值得发期刊」——这不是站台话，是具体技术评价。Fields奖得主说一份证明”够发期刊”，相当于学界对它的水准签了字。

三份文件一起摆出来

OpenAI这次没玩花活，发布材料是三份一起的：

证明本身
9位外部数学家联合写的检验/评注文章
模型推理过程的精简版思维链

第三份特别值得注意。

之前OpenAI发布benchmark结果的时候，思维链（chain-of-thought）一直藏着。这次主动晒出来，潜台词是——让数学界自己看，AI是真在做推导，还是凑答案凑到了。

这一动作扭转了一个长期质疑。过去几年大家担心AI解数学题”有可能是把训练集里的答案复述出来”。OpenAI把推理过程公开，相当于把这个问题摆到桌面上：你们自己判断这条思路是不是真的。

通用模型这条路又往前走了一步

AI做数学，两年里被反复辩论的是两条路线：

路线A：专用模型 + 大量数学数据

代表是Google DeepMind的AlphaProof。今年IMO拿金牌，做法是专门训练形式化证明的模型，配上交互式定理证明器Lean。

路线B：通用推理模型 + 跨领域知识

OpenAI这次走的是后一条。

路线A的好处是确定性高、可控；路线B的好处是有可能突然蹦出跨学科的创新——比如这次的”用代数数论解几何问题”。数学史上很多重大突破都是这种跨学科联想。

OpenAI官方给的定性是：

“This marks the first time AI has autonomously solved a prominent open problem central to a field of mathematics.”

「第一次AI自主解开了一道数学领域的核心开放题」——三个限定词都用得很谨慎。autonomously（自主）、prominent（重要）、central（核心）。意思是这事在同行评价上必须算成是AI做出的，不是程序员手把手指挥的成果。

至于下一道Erdős的开放题什么时候被破？光是Erdős生前留下来还没被破的著名开放题就上百道。

这事的真正含义不在数学本身，而在于——通用大模型解决科研开放题的曲线，第一次站稳了一格台阶。

参考来源：CocoLoop、An OpenAI model has disproved a central conjecture in discrete geometry（OpenAI官方）/ OpenAI Model Cracks Geometry's Toughest Nut（StartupHub.ai）/ Tildes ~science 讨论（含九位外部数学家署名核对的细节）