AI 6小时攻克30年数学难题！Aristotle模型引陶哲轩关注，Vibe证明时代来临

0 0

2025年12月1日，数学与AI领域共同见证了一场突破性事件——Harmonic公司旗下的Aristotle数学AI模型，仅用6小时就独立证明了悬而未决近30年的埃尔德什问题#124（Erdős问题#124）简易版。这一成果不仅被OpenAI研究AGI的Sebastien Bubeck（微软前AI副总裁）公开点赞，更吸引了菲尔兹奖得主陶哲轩的围观讨论。陶哲轩对比后发现，Aristotle的证明表现优于Gemini与ChatGPT的深度研究工具，标志着AI在数学推理领域的能力已迈入新台阶。

30年难题的“简易版突破”：AI如何读懂数学游戏规则？

埃尔德什问题#124由著名数学家保罗·埃尔德什提出，核心是一套“进制生成器凑数”的数学游戏：假设有k个不同的进制d₁、d₂……dₖ（如3进制、4进制），每个进制只能挑选一个由0和1组成的数字（如3进制中的1、3、9），能否通过相加这些数字，得到所有足够大的整数？前提是满足“1/(d₁-1)+1/(d₂-1)+…+1/(dₖ-1)≥1”这一关键条件。

30年来，这个问题分化为“严格版”与“简易版”两个方向：严格版（[BEGL96]）禁止使用数字1且需满足进制间的gcd（最大公约数）条件，仅在特定集合（如{3,4,7}）上被部分证明；而简易版（Erdös原版）允许使用数字1且无需gcd条件，却始终无人攻克。此次Aristotle模型证明的正是简易版，其解决方案经Lean形式化验证确认正确，证明逻辑出乎意料的简洁：将每个进制的幂次数字排序（如2进制与3进制的幂次序列为1,1,2,3,4,8,9…），通过证明“下一个数字减1不超过此前所有数字之和”，推导出所有大整数均可被凑出。

值得注意的是，此次证明还纠正了原问题表述的笔误——“形式化猜想”项目中，注释写“≥1”但Lean代码误写为“=1”，导致条件变弱。研究者Boris Alexeev修正错误后，Aristotle模型成功证明了更完整、准确的版本，覆盖“≥1”的所有情况，进一步凸显其对数学逻辑的精准理解。

Aristotle模型：不止于解题，更是数学推理的“革新者”

Aristotle能攻克这一难题，并非偶然。作为Harmonic公司的旗舰模型，它早已在数学领域崭露头角——2025年国际数学奥林匹克竞赛（IMO）中，它成为首个为五道题目提供形式化验证解决方案的AI，达到金牌级表现，且能严格避免“幻觉”，保证推理准确性。此次针对埃尔德什问题#124，模型还展现出两大核心优势：

一是“高效推理”。从接收问题到输出证明仅耗时6小时，而人类数学家曾为此研究数十年；二是“自然语言与形式化的衔接能力”。模型能理解自然语言表述的数学问题，同时输出符合Lean证明语言规范的结果，实现“从问题描述到严谨验证”的无缝衔接。陶哲轩就提到，Gemini与ChatGPT虽能解释问题背景，却未给出新突破，而Aristotle直接完成了证明，且逻辑清晰可验证。

Harmonic公司CEO Tudor Achim透露，此次使用的Aristotle模型经过最新更新，强化了推理深度与自然语言交互能力，能更好地理解复杂数学逻辑，甚至主动修正问题表述中的错误。这种“主动纠错+严谨证明”的组合，让业内看到AI从“辅助工具”向“独立研究者”转变的可能。

背后力量：14.5亿美元估值的Harmonic，瞄准“数学推理引擎”

Aristotle模型的亮眼表现，背后是Harmonic公司的技术积累与资本支持。这家成立于2023年的公司，目标明确——“打造世界上最先进的数学推理引擎”，两位联合创始人背景强劲：CEO Tudor Achim是卡内基梅隆大学计算机科学学士、斯坦福大学PhD（休学创业），曾联合创办自动驾驶公司Helm.ai并任CTO；执行主席Vlad Tenev拥有斯坦福数学学士、加州大学洛杉矶分校数学硕士学位，同时担任金融公司Robinhood Markets CEO。

资本层面，Harmonic在一周前刚完成1.2亿美元C轮融资（约合人民币8.5亿），由Ribbit Capital领投，公司估值飙升至14.5亿美元（约合人民币103亿）。这笔资金将进一步投入数学AI的研发，推动模型在更复杂的数学领域（如代数几何、拓扑学）实现突破。Vlad Tenev在社交平台激动表示：“我们正处于数学领域深刻变革的边缘，Vibe证明时代已经到来。”这里的“Vibe证明”，借鉴编程领域的“Vibe Coding”概念，指AI能凭借对数学逻辑的“直觉”，快速找到解题思路，而非机械试错。

行业启示：AI改写数学研究范式，挑战与希望并存

Aristotle模型的突破，不仅解决了一个具体的数学难题，更引发了对“AI如何重塑数学研究”的思考。一方面，AI能快速处理人类难以攻克的复杂推理，缩短难题解决周期——此次30年难题6小时告破，就是最好的例证；另一方面，AI的“形式化验证能力”能大幅降低数学证明的错误率，避免因人类疏忽导致的逻辑漏洞。陶哲轩就指出，未来AI或成为数学家的“重要搭档”，帮助验证猜想、探索解题方向。

不过，也需理性看待当前进展：Aristotle证明的仍是埃尔德什问题#124的简易版，更复杂的严格版仍未解决；且AI目前的优势集中在“已有明确逻辑框架”的问题上，面对需要全新数学思想的突破性难题，仍需人类的引领。正如Harmonic团队所言，AI的目标不是“取代数学家”，而是“加速数学进步”，让更多精力投入到开创性的理论探索中。

随着Aristotle等模型的持续进化，以及资本对数学AI领域的加码，越来越多曾被“束之高阁”的数学难题有望被重新审视。或许在不久的将来，AI与人类数学家的协作，会开启数学研究的“黄金时代”——而此次埃尔德什问题#124的突破，正是这个时代的序章。

# AI 资讯