2025年12月1日,数学与AI领域共同见证了一场突破性事件——Harmonic公司旗下的Aristotle数学AI模型,仅用6小时就独立证明了悬而未决近30年的埃尔德什问题#124(Erdős问题#124)简易版。这一成果不仅被OpenAI研究AGI的Sebastien Bubeck(微软前AI副总裁)公开点赞,更吸引了菲尔兹奖得主陶哲轩的围观讨论。陶哲轩对比后发现,Aristotle的证明表现优于Gemini与ChatGPT的深度研究工具,标志着AI在数学推理领域的能力已迈入新台阶。
30年难题的“简易版突破”:AI如何读懂数学游戏规则?
埃尔德什问题#124由著名数学家保罗·埃尔德什提出,核心是一套“进制生成器凑数”的数学游戏:假设有k个不同的进制d₁、d₂……dₖ(如3进制、4进制),每个进制只能挑选一个由0和1组成的数字(如3进制中的1、3、9),能否通过相加这些数字,得到所有足够大的整数?前提是满足“1/(d₁-1)+1/(d₂-1)+…+1/(dₖ-1)≥1”这一关键条件。
30年来,这个问题分化为“严格版”与“简易版”两个方向:严格版([BEGL96])禁止使用数字1且需满足进制间的gcd(最大公约数)条件,仅在特定集合(如{3,4,7})上被部分证明;而简易版(Erdös原版)允许使用数字1且无需gcd条件,却始终无人攻克。此次Aristotle模型证明的正是简易版,其解决方案经Lean形式化验证确认正确,证明逻辑出乎意料的简洁:将每个进制的幂次数字排序(如2进制与3进制的幂次序列为1,1,2,3,4,8,9…),通过证明“下一个数字减1不超过此前所有数字之和”,推导出所有大整数均可被凑出。
值得注意的是,此次证明还纠正了原问题表述的笔误——“形式化猜想”项目中,注释写“≥1”但Lean代码误写为“=1”,导致条件变弱。研究者Boris Alexeev修正错误后,Aristotle模型成功证明了更完整、准确的版本,覆盖“≥1”的所有情况,进一步凸显其对数学逻辑的精准理解。
Aristotle模型:不止于解题,更是数学推理的“革新者”
Aristotle能攻克这一难题,并非偶然。作为Harmonic公司的旗舰模型,它早已在数学领域崭露头角——2025年国际数学奥林匹克竞赛(IMO)中,它成为首个为五道题目提供形式化验证解决方案的AI,达到金牌级表现,且能严格避免“幻觉”,保证推理准确性。此次针对埃尔德什问题#124,模型还展现出两大核心优势:
一是“高效推理”。从接收问题到输出证明仅耗时6小时,而人类数学家曾为此研究数十年;二是“自然语言与形式化的衔接能力”。模型能理解自然语言表述的数学问题,同时输出符合Lean证明语言规范的结果,实现“从问题描述到严谨验证”的无缝衔接。陶哲轩就提到,Gemini与ChatGPT虽能解释问题背景,却未给出新突破,而Aristotle直接完成了证明,且逻辑清晰可验证。
Harmonic公司CEO Tudor Achim透露,此次使用的Aristotle模型经过最新更新,强化了推理深度与自然语言交互能力,能更好地理解复杂数学逻辑,甚至主动修正问题表述中的错误。这种“主动纠错+严谨证明”的组合,让业内看到AI从“辅助工具”向“独立研究者”转变的可能。
背后力量:14.5亿美元估值的Harmonic,瞄准“数学推理引擎”
Aristotle模型的亮眼表现,背后是Harmonic公司的技术积累与资本支持。这家成立于2023年的公司,目标明确——“打造世界上最先进的数学推理引擎”,两位联合创始人背景强劲:CEO Tudor Achim是卡内基梅隆大学计算机科学学士、斯坦福大学PhD(休学创业),曾联合创办自动驾驶公司Helm.ai并任CTO;执行主席Vlad Tenev拥有斯坦福数学学士、加州大学洛杉矶分校数学硕士学位,同时担任金融公司Robinhood Markets CEO。
资本层面,Harmonic在一周前刚完成1.2亿美元C轮融资(约合人民币8.5亿),由Ribbit Capital领投,公司估值飙升至14.5亿美元(约合人民币103亿)。这笔资金将进一步投入数学AI的研发,推动模型在更复杂的数学领域(如代数几何、拓扑学)实现突破。Vlad Tenev在社交平台激动表示:“我们正处于数学领域深刻变革的边缘,Vibe证明时代已经到来。”这里的“Vibe证明”,借鉴编程领域的“Vibe Coding”概念,指AI能凭借对数学逻辑的“直觉”,快速找到解题思路,而非机械试错。
行业启示:AI改写数学研究范式,挑战与希望并存
Aristotle模型的突破,不仅解决了一个具体的数学难题,更引发了对“AI如何重塑数学研究”的思考。一方面,AI能快速处理人类难以攻克的复杂推理,缩短难题解决周期——此次30年难题6小时告破,就是最好的例证;另一方面,AI的“形式化验证能力”能大幅降低数学证明的错误率,避免因人类疏忽导致的逻辑漏洞。陶哲轩就指出,未来AI或成为数学家的“重要搭档”,帮助验证猜想、探索解题方向。
不过,也需理性看待当前进展:Aristotle证明的仍是埃尔德什问题#124的简易版,更复杂的严格版仍未解决;且AI目前的优势集中在“已有明确逻辑框架”的问题上,面对需要全新数学思想的突破性难题,仍需人类的引领。正如Harmonic团队所言,AI的目标不是“取代数学家”,而是“加速数学进步”,让更多精力投入到开创性的理论探索中。
随着Aristotle等模型的持续进化,以及资本对数学AI领域的加码,越来越多曾被“束之高阁”的数学难题有望被重新审视。或许在不久的将来,AI与人类数学家的协作,会开启数学研究的“黄金时代”——而此次埃尔德什问题#124的突破,正是这个时代的序章。