【量子位 2025年12月14日讯】数学界再迎里程碑事件!12月13日,菲尔茨奖得主、华裔数学家陶哲轩通过社交平台宣布,他与全球多位数学家协作,在AI工具的深度辅助下,仅用48小时就破解了尘封半个世纪的Erdős#1026难题。这一难题自1975年由传奇数学家保罗·埃尔德什提出以来,因表述模糊、求解路径复杂,长期困扰数学界。此次破解不仅刷新了难题求解效率,更以“人类协作+AI赋能”的模式,为数学研究开辟了全新范式。
难题溯源:从“模糊猜想”到“博弈论具象”,50年悬而未决
Erdős#1026的破解,首先要从问题本身的“清晰化”说起。1975年,埃尔德什在论文中提出初始问题:“设X₁,…,Xₙ是互不相同的实数序列,确定所有单调子序列的最大和”。但这一表述过于笼统,既未明确“最大和”的约束条件,也未界定研究方向,导致此后数十年进展寥寥。
直到2025年,数学家德斯蒙德·魏森伯格(Desmond Weisenberg)用“博弈论”视角为问题给出清晰定义,才让求解有了明确目标:将问题转化为“Alice与Bob的硬币分配游戏”——Alice将N枚硬币分成n堆(每堆数量为Xᵢ),Bob只能选择单调子序列(递增或递减)的堆拿走硬币,求Bob无论如何分配都能保证拿到的“最小硬币比例”,这个比例即为关键常数c(n)。
通过简单案例推导,陶哲轩率先给出基础结论:当n=1时,c(1)=1(Bob能拿走唯一一堆);n=2时,c(2)=1(两堆必呈单调,Bob可全拿);n=3时,c(3)=2/3(Bob至少能拿两堆)。而数学家斯泰恩·坎比(Stijn Cambie)进一步计算出c(n)的前几组近似值:1、1、2/3、1/2、1/2、3/7、2/5……这些零散数据,为后续AI辅助推导埋下伏笔。
48小时攻坚:AI当“工具人”,多步突破关键瓶颈
此次破解过程中,AI并非独立解题,而是以“数据生成器”“证明验证器”“文献检索员”等多重角色,与人类数学家形成高效协作,每一步突破都离不开人机配合:
第一步:AI将问题转化为“矩形填充”,打开解题突破口
12月7日,数学家鲍里斯·阿列克谢夫(Boris Alexeev)率先借助Harmonic公司的数学AI模型“亚里士多德”(Aristotle),在证明助手Lean中自动构造并证明了关键不等式c(k²)=1/k。这一突破的核心在于,AI将原本的组合数学问题,转化为计算几何领域的“矩形填充问题”——通过设计特定的数字排列结构,证明当序列长度为k²时,Bob能拿到的最小比例恰好为1/k。
不到1小时,另一位数学家小泉小石(Koishi Chan)基于AI结论,用经典的“埃尔德什-塞凯赖斯定理”(Erdős–Szekeres定理)给出人工替代证明,双重验证了AI结果的可靠性,为后续推导奠定基础。
第二步:AlphaEvolve生成极值序列,锁定c(n)上界
12月8日,陶哲轩注意到这一进展后,将问题输入AI工具AlphaEvolve,设定“生成总和为10⁶的实数序列”任务,要求AI尽可能缩小单调子序列的最大和,从而获取c(n)的上界。1小时后,AI输出了n=1至16的序列数据,分数值(除以10⁶后)清晰呈现出有理数规律:1、1、2/3、1/2、2/4、3/7……
陶哲轩随即利用数学家约翰·库克(John Cook)的专用工具,将AI生成的杂乱数据整理为有序序列,据此提出猜想:c(k²+2a+1)=k/(k²+a)(其中k≥1,-k≤a≤k),这一猜想成为后续证明的核心框架。
第三步:ChatGPT绘图+AI文献检索,完成最终证明
为直观验证猜想,陶哲轩用ChatGPT Pro生成1/c(n)的图像,结果显示其曲线恰好是对平方根函数的“分段线性逼近”,从视觉上印证了猜想的合理性。
随后,数学家劳伦斯·吴(Lawrence Wu)结合另一道埃尔德什难题#106(正方形填充问题),将c(n)与“单位正方形内n个小正方形的边长和最大值”关联,进一步强化猜想的几何意义。关键的是,劳伦斯通过AI文献检索工具,快速找到2024年由Baek、Koizumi和Ueoro联合发表的论文,该论文中的定理恰好能证明陶哲轩提出的猜想公式。
最终,陶哲轩将所有推导步骤、数据与文献结论输入ChatGPT,由AI生成连贯的完整证明,经Lean验证无误后,Erdős#1026难题正式告破。
背后逻辑:AI不是“主角”,却是“效率放大器”
陶哲轩在后续博客中强调,此次破解的核心价值并非“AI替代人类”,而是“人机协作重构效率”。若采用传统方法,仅靠1-2位数学家手动编程、检索文献,至少需要数周甚至数月才能完成;而AI通过以下三点,将效率提升数十倍:
-
数据生成高效化:AlphaEvolve在1小时内完成的序列生成任务,若人工编程调试,可能需要数小时甚至数天;
-
证明验证自动化:Lean与AI模型“亚里士多德”联动,实时验证每一步推理的逻辑严谨性,避免人类因计算失误走弯路;
-
文献检索精准化:AI快速定位到关键旧论文,而这类文献因发表时间早、关联度隐蔽,人类手动检索极易遗漏。
不过陶哲轩也指出,AI的局限性依然明显:它无法提出核心猜想、无法设计创新性的问题转化路径,更无法像人类一样在多个数学领域间建立跨学科关联——这些“创造性工作”,仍是人类数学家的专属领域。
行业启示:AI辅助成数学研究新趋势,Erdős网站开放“人机协作”
此次破解并非个例,而是AI融入数学研究的缩影。事实上,陶哲轩此前已多次借助AI解题:2025年10月,他用GPT-5生成29行Python代码,验证了“最小公倍数数列是否为高度丰数子集”的问题;更早前,他还通过Gemini 2.5 Deep Think,仅用10分钟补全了Erdős#367难题的证明漏洞。
如今,收录埃尔德什难题的官方网站erdosproblems.com,已正式鼓励研究者使用AI辅助解题,并出台明确规则:AI生成内容需公开标注,且必须经人类独立验证,确保数学严谨性。就在Erdős#1026破解前几天,该网站还记录了另一则案例——AI模型独立证明了悬而未决30年的Erdős#124,整个过程耗时仅6小时,由OpenAI研究员塞巴斯蒂安·布贝克(Sebastien Bubeck)证实“100% AI生成”。
正如陶哲轩所言:“AI短期内不会获得菲尔兹奖,但它就像数学家的‘瑞士军刀’,能处理繁琐的计算、检索和验证工作,让人类专注于更有创造性的思考。”随着人机协作模式的成熟,或许未来更多“悬而未决”的数学难题,将以“天级”“小时级”的速度被攻克。