AI第一次自己解开数学开放题:OpenAI内部模型反掉Erdős的80年猜想,9位数学家联署盖章

5月20号晚上,OpenAI扔了一份证明出来。

1946年Paul Erdős问过一个问题:平面上摆n个点,能有多少对点彼此距离恰好等于1?整整80年里,数学界主流的答案是——按方格排大致就接近最优,对数最多到 n^(1+o(1))——意思是几乎线性,超出线性的部分随n增大可以忽略到无穷小。

OpenAI的一个内部推理模型把这个故事改写了。

翻过了什么

模型证明了:存在一个固定的常数 δ > 0,使得至少能找到 n^(1+δ) 对单位距离。

「o(1)」和「δ > 0」这两个看着差不多,差别是天和地。前者意味着多项式之外的部分趋于零、可以忽略;后者意味着永远有一段固定大小的多项式增长摆在那儿,怎么把n推大也消不掉

证明思路更有意思——用代数数论搭出来的

具体说,模型把这个看起来纯几何的问题,桥接到了代数数论里的某些工具,找到了一族无穷多的反例构造。普林斯顿的Noga Alon看完之后给的评价是:

“The construction uses sophisticated tools from algebraic number theory in an elegant and clever way.”

这是数学家给同行打高分时的措辞,从Alon这种级别的人嘴里出来分量很重。

用的不是数学专用模型

这事的两个关键信号必须分清楚。

第一,不是GPT-5、不是数学专用模型,是个通用推理模型。

OpenAI没说具体型号,只说”internal model”。但他们刻意强调了这一点:跟AlphaProof那种为数学训练的专用系统不一样,这次的模型没经过专门的几何或代数数论训练,靠的是跨领域推理——拿A领域的工具去钉B领域的钉子。

第二,这次靠谱。

2025年10月OpenAI第一次宣称自家模型解了某道数学开放题,三天后被数学家Thomas Bloom挑出bug,全网刷屏的”突破”灰溜溜撤回。这次OpenAI做了件挺解释成本的事——把Bloom自己请进了独立验证名单。

陪审团一共9个人,包括:

  • Tim Gowers(Fields奖得主)
  • Noga Alon(普林斯顿)
  • Thomas Bloom(去年的”挑错人”)
  • Daniel Litt
  • Arul Shankar
  • Jacob Tsimerman
  • Melanie Matchett Wood

九个人审完,联名出了一份companion paper给证明背书。

Gowers给的定调最直接:

“A milestone in AI mathematics, worthy of journal publication.”

「值得发期刊」——这不是站台话,是具体技术评价。Fields奖得主说一份证明”够发期刊”,相当于学界对它的水准签了字。

三份文件一起摆出来

OpenAI这次没玩花活,发布材料是三份一起的:

  1. 证明本身
  2. 9位外部数学家联合写的检验/评注文章
  3. 模型推理过程的精简版思维链

第三份特别值得注意。

之前OpenAI发布benchmark结果的时候,思维链(chain-of-thought)一直藏着。这次主动晒出来,潜台词是——让数学界自己看,AI是真在做推导,还是凑答案凑到了

这一动作扭转了一个长期质疑。过去几年大家担心AI解数学题”有可能是把训练集里的答案复述出来”。OpenAI把推理过程公开,相当于把这个问题摆到桌面上:你们自己判断这条思路是不是真的。

通用模型这条路又往前走了一步

AI做数学,两年里被反复辩论的是两条路线:

路线A:专用模型 + 大量数学数据

代表是Google DeepMind的AlphaProof。今年IMO拿金牌,做法是专门训练形式化证明的模型,配上交互式定理证明器Lean。

路线B:通用推理模型 + 跨领域知识

OpenAI这次走的是后一条。

路线A的好处是确定性高、可控;路线B的好处是有可能突然蹦出跨学科的创新——比如这次的”用代数数论解几何问题”。数学史上很多重大突破都是这种跨学科联想。

OpenAI官方给的定性是:

“This marks the first time AI has autonomously solved a prominent open problem central to a field of mathematics.”

「第一次AI自主解开了一道数学领域的核心开放题」——三个限定词都用得很谨慎。autonomously(自主)、prominent(重要)、central(核心)。意思是这事在同行评价上必须算成是AI做出的,不是程序员手把手指挥的成果。

至于下一道Erdős的开放题什么时候被破?光是Erdős生前留下来还没被破的著名开放题就上百道。

这事的真正含义不在数学本身,而在于——通用大模型解决科研开放题的曲线,第一次站稳了一格台阶。

参考来源:An OpenAI model has disproved a central conjecture in discrete geometry(OpenAI官方)/ OpenAI Model Cracks Geometry's Toughest Nut(StartupHub.ai)/ Tildes ~science 讨论(含九位外部数学家署名核对的细节)