陶哲轩力推!AlphaEvolve破解67道数学难题,改写56年铁律,AI开始教人类做研究了?

# 陶哲轩力推!AlphaEvolve 破解 67 道数学难题,改写 56 年铁律,AI 开始教人类做研究了?

就在 Kimi K2 Thinking 以开源之力撼动闭源 AI 霸权的同一天,谷歌 DeepMind 用一项颠覆性成果重新定义了 “AI 的科学价值”。11 月 7 日,量子位独家披露,由陶哲轩等顶尖科学家参与研发的通用科学 AI AlphaEvolve,在组合数学、几何、数论等领域的 67 个数学问题中取得突破性进展:它不仅打破矩阵乘法领域 56 年未变的效率基准,更在算术 Kakeya 猜想等难题上超越人类已知最优解,甚至能为数学家提供 “直觉跳板” 启发新发现。

这场突破的意义远超一次技术升级 —— 正如 AlphaGo 用 “神之一手” 改写围棋历史,AlphaEvolve 正用算法进化的力量,让 AI 从 “解题工具” 蜕变为 “科学研究的共创者”。当 Kimi K2 还在争夺 “谁的 AI 更易用” 时,AlphaEvolve 已经开始探索 “AI 能帮人类走多远”。

战绩震撼:从改写 56 年铁律到启发新论文

AlphaEvolve 的实力,藏在一组组改写历史的数据与一项项科研突破中。与 Kimi K2 聚焦 “工程化性能” 不同,它的战场直指人类智慧的核心堡垒 —— 数学发现,且交出了足以让学界震动的答卷。

1. 矩阵乘法:48 次运算击碎 49 次铁律

最令人瞩目的突破,是它打破了 Strassen 算法保持 56 年的效率纪录。1969 年提出的该算法确立了 4×4 矩阵乘法需 49 次标量乘法的基准,半个多世纪以来,无数数学家尝试突破均无功而返。而 AlphaEvolve 通过自主探索,将这一数字降至 48。

这看似微小的 “一步”,实则引发连锁反应:在谷歌内部测试中,该优化使 Gemini 架构的矩阵乘法运算加速 23%,直接缩短 1% 的模型训练时间,更让 FlashAttention 效率提升 32.5%。“这堪比 AlphaGo 打败李世石的第 37 步‘神之一手’,是算法领域的历史性跨越。” 一位谷歌前员工如此评价。

2. 67 题大考:跨领域突破 + 人类启发者角色

在涵盖组合数学、几何、数学分析等多领域的 67 个问题测试中,AlphaEvolve 展现了 “通用科学 AI” 的特质:

  • 超越人类最优解:在算术 Kakeya 猜想中,将已知下界从 1.61226 提升至 1.668,其构造的离散高斯分布形态解,还帮助人类数学家建立了新的渐近关系,相关成果即将发表;

  • 提供研究跳板:处理 Nikodym 集问题时,生成的初始构造虽非最优,却为研究者提供了关键直觉,最终合作改进了已知上界,形成独立数学论文;

  • 复现与优化并重:不仅精准复现众多已知最优解,还能在积木堆叠问题中,将递归程序自主重构为显式公式,清晰揭示最优解与谐波数的数学关联,与人类理论完全吻合。

陶哲轩在合著论文中直言:“它不是简单的解题工具,而是数学发现的有力新伙伴。其输出的结构化代码让人类能轻松分析模式,这是此前任何 AI 都无法做到的。”

技术密码:让 AI “自由进化” 的四大支柱

AlphaEvolve 的突破并非偶然,而是 DeepMind 融合进化算法与大模型能力的必然结果。这套技术体系与 Kimi K2 的 “思考放大器” 逻辑迥异,更强调 “自主探索与迭代优化”,核心源于四大技术创新:

1. 进化算法 + LLM:生成 “找答案的算法”

与直接输出解决方案的传统 AI 不同,AlphaEvolve 本质是 “生成算法的算法”。它以 Gemini Flash 和 Gemini Pro 为基础,通过进化算法框架迭代优化候选方案:Gemini Flash 快速生成大量代码片段,Gemini Pro 深入挖掘规律并整合,再由进化系统按 “适者生存” 原则筛选、变异、组合,最终逼近最优解。

这种模式解决了 “LLM 慢” 与 “局部搜索浅” 的矛盾 —— 一次 LLM 调用生成高效搜索策略,随后触发数百万次廉价计算自主探索,效率较传统方法提升百倍。

2. 打破 “对称性陷阱”:完全自由的探索模式

人类数学家常受 “经验法则” 束缚,比如习惯固定分块处理矩阵问题,这容易陷入局部最优解。AlphaEvolve 则彻底摆脱预设限制,在完全开放的搜索空间中探索。其突破 4×4 矩阵乘法的关键,正是放弃人类惯用的实数域搜索,转向复数域探索后意外发现可迁移的优化方案。

“让 AI 摆脱人类直觉的桎梏,反而能看到我们看不到的路径。”DeepMind 研究员 Matej Balog 解释道。

3. 双模式工作流:兼顾精度与泛化

针对不同数学问题,AlphaEvolve 设计了两种核心工作模式:

  • 搜索模式:演化 “搜索启发式算法” 而非直接生成答案,在固定时间预算内高效寻找最优构造,适合追求精度的问题;

  • 泛化模式:要求系统生成适用于任意参数的通用程序,通过稀疏实例训练归纳共同规律,在 IMO 2025 第 6 题中,仅靠完全平方数数据就找到通用最优解。

这种灵活适配能力,使其既能攻坚具体难题,又能提炼通用理论。

4. 异步分布式架构:资源智能匹配

系统采用异步分布式运行,不同计算节点可并行处理算法生成、指标评估等任务,且能根据问题难度自动调整资源投入 —— 简单问题即时解决,复杂问题如矩阵乘法可调度数百小时算力攻坚,实现资源利用效率最大化。

科研革命:从 “工具辅助” 到 “人机共创”

AlphaEvolve 的出现,正在重塑数学研究的范式。如果说 Kimi K2 的价值是 “降低 AI 使用门槛”,那么 AlphaEvolve 的意义则是 “提升人类科研上限”,其带来的变革已初现端倪:

1. 加速基础科学转化

数学突破的价值正快速渗透到工程领域。除了优化 Gemini 训练与 FlashAttention,其改进的矩阵乘法算法还能提升芯片设计效率、降低数据中心能耗。“以往需要数年才能落地的数学成果,现在 AI 能直接生成可部署的算法。” 谷歌研究员指出。

2. 重构人机协作模式

AlphaEvolve 展现了 “AI 启发人类” 的新型协作关系:它不替代数学家,而是提供 “非直觉性构造” 作为思考起点。在 Nikodym 集问题中,人类研究者正是基于 AI 生成的复杂结构,通过简化与推演获得新突破,这种 “AI 探路 + 人类提炼” 的模式已成为论文合作的新范式。

3. 暴露 AI 科研局限

尽管表现惊艳,AlphaEvolve 仍有明显短板:在 5×5、6×6 等更大规模矩阵乘法中,因搜索空间爆炸且缺乏对称性偏置,未能超越现有最优解。这揭示了通用科学 AI 的核心挑战 —— 如何在 “完全开放探索” 与 “针对性约束” 间找到平衡。

终极野心:打造自我进化的 “科学引擎”

DeepMind 的目标远不止解决数学问题,而是构建能持续推动科学进步的 “自主进化引擎”。从技术路径看,AlphaEvolve 已展现自我增强的潜力:其优化的算法被用于改进 Gemini 架构后,模型性能提升又反哺 AI 的搜索与推理能力,形成 “算法优化 – 模型变强 – 发现更优算法” 的闭环。

陶哲轩在论文中透露,未来将重点强化三大方向:提升基础模型能力以加速发现效率、优化人机协作流程减少人工干预、扩展至物理、化学等更多科学领域。“我们期待它能像 AlphaGo 推动围棋发展那样,成为数学与算法创新的‘催化剂’。”

结语:AI 竞争的 “双轨时代” 已至

AlphaEvolve 与 Kimi K2 Thinking 的相继亮相,勾勒出 AI 产业竞争的两条核心赛道:一条是 Kimi K2 代表的 “工程化赛道”,聚焦性能优化、成本降低与生态普及,让 AI 技术惠及更多用户;另一条是 AlphaEvolve 代表的 “科学化赛道”,瞄准基础研究突破,探索 AI 与人类智慧的共创边界。

如果说 Kimi K2 的突破是 “让 AI 更有用”,AlphaEvolve 的进步则是 “让 AI 更有远见”。前者改写了 AI 的产业格局,后者则可能重塑人类探索未知的方式。当开源力量与科研巨头在不同赛道齐头并进,AI 的未来不再是单一的 “技术竞赛”,而是 “普惠应用” 与 “前沿突破” 并行的双轨时代 —— 而这,或许正是人工智能最值得期待的模样。

© 版权声明

相关文章