标签: Erdős猜想

  • 谷歌DeepMind用AI一口气证明9道56年数学难题,单题成本仅数百美元

    谷歌DeepMind最近搞了个大动作——AlphaProof Nexus,一个由Gemini驱动的形式化证明框架,一口气解决了9道悬而未决的埃尔德什(Erdős)数学开放问题,其中最老的已经被卡了56年。与此同时,它还顺手证明了在线整数序列百科(OEIS)里44个未解猜想。

    Google DeepMind AlphaProof Nexus
    AlphaProof Nexus 由 Gemini 驱动,结合 Lean 形式化验证

    不是”AI猜答案”,而是”机器可验证的证明”

    这次和以前那些”AI做数学题”的新闻不太一样。AlphaProof Nexus 的核心是把大语言模型(LLM)和 Lean 形式化验证工具绑在一起——LLM负责生成证明思路,Lean 负责严格校验每一步逻辑是否真的成立。

    这样做的好处是:证明不是”看起来对”,而是”机器严格验证过对”。传统数学界对AI生成证明最大的质疑就是”你咋知道它没在胡说”,Lean 验证正好堵住了这个漏洞。

    关键突破:单次推理成本仅数百美元,论文与代码已在 GitHub 开源(arXiv:2605.22763,CC BY-NC-ND 4.0 协议)。

    哪些问题被解决了?

    这次解决的9道 Erdős 问题横跨组合数学和图论,其中两个最引人注目的问题已经被卡了56年。完整列表在论文附录里,这里说几个有意思的:

    • Erdős #12:关于整数序列中等差数列密度的猜想,困扰学界超过半个世纪
    • Erdős #125:30年无人给出完整证明的图论问题
    • Erdős #846:34年悬而未决的组合数学问题
    • 其余6道问题同样来自 Erdős 遗留的353道开放问题清单,这次共解决了9道
    • 额外证明了 OEIS 百科中44个序列猜想,覆盖组合学、优化、图论、代数几何、量子光学等领域

    和 OpenAI 的那次突破有什么区别?

    就在前不久,OpenAI 宣布他们的 AI 推翻了一个有80年历史的 Erdős 猜想。两边都在做”AI+数学证明”,但路径不太一样:

    OpenAI 那次更多依赖强化学习驱动的推理,而 DeepMind 这次走的是”LLM生成 + Lean 形式化验证”的路线,两种路径各有优劣。形式化验证的好处是证明可以被机器完整检查,数学界更容易接受。

    目前 AlphaProof Nexus 还不能解决那些需要全新数学构造的问题——它强在”验证了,不是”从无到有发明了新数学”。这个界限,也是整个领域下一步要攻克的。

    这个方向意味着什么?

    以前数学家要验证一篇论文的证明是否正确,往往要花数周甚至数月。如果 AI 能快速生成”机器可验证”的证明草稿,数学研究的速度会被整个提起来。

    当然,现在说”AI 取代数学家”还早得很。目前系统能处理的是”已经被明确表述出来的数学问题”,那些需要人类直觉去”发现正确的问题”的部分,AI 还差得很远。但作为一个”超级研究助手”,它已经很能打了。


    📎 原文来源:AlphaProof Nexus 论文(arXiv:2605.22763) | 参考:agentupdate.ai、IT之家、知乎相关讨论
  • OpenAI声称解决80年数学难题,这次有数学家背书

    七个月前,OpenAI前副总裁Kevin Weil在X平台上高调宣布GPT-5解决了10个未解的Erdős问题,结果被证明那些”解”早就写在公开文献里。Yann LeCun和DeepMind的Demis Hassabis纷纷嘲讽,Weil只好默默删帖。

    这次OpenAI学乖了。2026年5月20日,他们声称新的推理模型推翻了Paul Erdős在1946年提出的几何猜想,而且这次找来了数学家Noga Alon、Melanie Wood和Thomas Bloom背书——正是Bloom上次公开批评OpenAI”严重误导”。

    Erdős数学问题示意图
    OpenAI称其模型发现了全新的几何构造族,推翻了近80年的数学共识(图源:OpenAI)

    不是专用系统,是通用推理模型

    OpenAI特别强调,这次产出证明的不是专门为数学设计的系统,而是一款通用推理模型。这意味着AI现在能处理更长的推理链,还能把不同领域的想法串起来——这种能力对生物学、物理学、工程和医学都有意义。

    “近80年来,数学家们一直认为最佳的可能解法大致类似于平方网格。现在OpenAI的一个模型推翻了这一认知,发现了一种全新的构造族,性能更优。”——OpenAI官方声明

    Thomas Bloom说:”人工智能正在帮助我们更全面地探索几个世纪以来我们建造的数学大教堂。还有哪些未被发现的美妙事物在等待着我们?”这位数学家上次可是OpenAI的批评者,他能出面背书,可信度比上次高多了。


    为什么这次可能真不一样

    上次翻车之后,OpenAI这次显然更谨慎了。除了发布公告,他们还专门拉来了几位数学家的支持性评论,其中Bloom运营的Erdős问题网站正是上次戳穿OpenAI夸大宣传的那位。

    如果这次真的站得住脚,这会是AI第一次自主解决数学领域核心的知名开放问题。但数学界向来谨慎,最终还得经过同行评审才能定论。OpenAI把详细证明放在了官网上,感兴趣的可以去扒一扒。

  • OpenAI声称解决80年数学难题,这次好像是真的

    80年前,匈牙利数学家保罗·厄多斯(Paul Erdős)提出了一个几何猜想,数学家们围绕它研究了大半个世纪。现在,OpenAI站出来说:我们的模型推翻了它。

    Erdős数学问题示意图
    厄多斯猜想相关数学问题示意图 | 图片来源:TechCrunch

    听到这个消息,第一反应可能是:又来了。7个月前,OpenAI前副总裁凯文·韦尔(Kevin Weil)在X平台上高调发文,说GPT-5找到了10个此前未解的厄多斯问题解决方案。结果被打脸了——那些”解决方案”早就存在于已有的学术文献中。竞争对手杨立昆和DeepMind首席执行官哈萨比斯都出来嘲讽,韦尔很快删了那条帖子。

    “近80年来,数学家们一直认为最优的解决方案大致类似方形网格。OpenAI的模型现在已经推翻了这一认知,发现了一种全新的构造家族,其表现更优。”

    这次有什么不同

    上次是野生宣传,这次OpenAI学乖了。随声明一同发布的,有数学家诺加·阿隆(Noga Alon)、梅兰妮·伍德(Melanie Wood)和托马斯·布鲁姆(Thomas Bloom)的支持性说明。布鲁姆是”厄多斯问题网站”的维护者,上次韦尔发那条不实帖子时,正是布鲁姆站出来说那是一条”严重歪曲事实”的声明。

    也就是说,这次站在OpenAI背后的,是上次亲手拆穿他们谎言的同一个人。如果连布鲁姆都认可了,可信度确实高了不少。

    OpenAI表示,这次给出证明的不是专门为解数学题训练的系统,而是一个新的通用推理模型。这意味着AI系统现在更有能力维持长链条的复杂推理,并且以研究人员此前未探索过的方式跨领域连接不同的想法。

    为什么这件事重要

    OpenAI在声明里说,这标志着”AI首次自主解决了一个数学领域核心的知名开放问题”。这话听起来有点自卖自夸,但背后的逻辑是成立的——如果一个AI系统能在纯数学领域给出人类未曾发现过的原创证明,那么它在生物学、物理学、工程学和医学领域的应用潜力就变得非常真实了。

    托马斯·布鲁姆说了一句挺有意思的话:”AI正在帮助我们更全面地探索我们数百年来建造的数学殿堂,还有哪些看不见的惊喜在等待我们去发现?”这话听起来有点文艺,但指向的问题很硬核:人类数学研究受限于人脑的推理链长度和信息整合能力,AI如果真的能突破这个瓶颈,整个基础科学的研究节奏都会被改写。


    当然,科学圈向来谨慎。OpenAI说它解决了,和数学界公认它解决了,是两回事。同行评议和程序化验证还在路上。但至少这次,OpenAI没有像上次那样提前开香槟。

  • OpenAI推理模型推翻80年数学猜想,AI数学能力真的起飞了

    5月20日,OpenAI宣布了一个在数学圈炸锅的消息:他们的一款内部推理模型,成功推翻了保罗· Erdős在1946年提出的「单位距离猜想」。这个问题困扰了数学界将近80年,现在被AI给解了。

    如果你对Erdős这个名字不太熟悉——他是20世纪最多产的数学家之一,一生发表了1500多篇论文,提出的开放问题多得数不清。这个「单位距离猜想」说的是:在平面上放一堆点,如果任意两个点的距离都是1(单位距离),那么这种点的排列方式有没有上限?

    Erdős猜想的答案可能是「没有上限」——你可以构造任意大的点集,使得所有点对的距离都是1。OpenAI的模型给出了一个新的构造方法,证明了Erdős的直觉是对的。

    为什么这次值得认真看待

    今年2月,OpenAI前副总裁Kevin Weil曾经宣称「GPT-5解决了10个Erdős问题」,结果被数学界集体打脸——那些「证明」经不起推敲,有些甚至是错的。

    但这次不一样。OpenAI找了Noga Alon和Melanie Wood这两位顶级数学家独立验证,结论是对的。这种级别的同行评议,基本等于把「AI证明」这件事从「噱头」提升到了「科研工具」的层次。


    菲尔兹奖得主也下场了

    就在OpenAI官宣的前几天,剑桥大学数学教授Timothy Gowers(菲尔兹奖得主)发了一篇博客,详细记录了他用ChatGPT 5.5 Pro做数学研究的经历。他的评价是:「这是我第一次真正感受到AI在数学推理上的突破。」

    Gowers用ChatGPT 5.5 Pro处理了几道博士级别的原创性数学问题,模型大约花了一个小时就给出了完整的解答过程。他自己动手验算了一遍,逻辑是通的。

    菲尔兹奖得主的背书分量很重。如果连Gowers都觉得「这玩意儿真的能干活」,那AI在数学领域的应用可能比我们想象的要快得多。

    对AI研究的启示

    这次突破的意义,不只是「AI会做数学题」这么简单。它说明了一点:大模型的推理能力已经开始触及「原创性思维」的边界

    过去我们觉得AI擅长的是「模式识别」——给它看成千上万道微积分题,它能学会做题的规律。但Erdős猜想这种问题,没有「题库」可以刷,需要的是真正的数学直觉和构造能力。

    • OpenAI的模型用的是「推理链」机制——它会自己分解问题、尝试不同的构造方法、反复验证每一步的正确性
    • 这种能力如果迁移到软件工程、芯片设计、药物发现这些领域,影响会是系统性的
    • 当然,目前还停留在「辅助研究」阶段,离「AI独立做科研」还有距离

    写在最后

    从2月被数学界打脸,到5月拿出经得起验证的证明,OpenAI用了大约三个月。这个节奏,比很多人预期的要快。

    AI会不会在不久的将来成为数学家的「标配工具」,就像现在的数学家离不开Latex和Mathematica一样?这个答案,可能比我们想象的更早到来。