破解AI“黑盒”的华人学者归国!KAN架构提出者刘子鸣9月入职清华,携三大研究方向深耕AI与科学交叉

【量子位 2026年1月15日讯】全球AI学术界再迎人才回流重磅消息。清华大学人工智能学院官网近日正式公示,曾提出革命性神经网络架构KAN(Kolmogorov-Arnold Networks)的麻省理工学院(MIT)博士刘子鸣,拟于2026年9月以助理教授身份加入该院。这位年仅28岁的华人学者,凭借KAN架构打破传统MLP(多层感知机)的“黑盒困境”,相关论文引用量超3000次,如今选择回国深耕AI与科学交叉领域,被业内视为“中国在可解释AI赛道增强科研实力”的重要信号。

一、从物理竞赛生到AI架构革新者:刘子鸣的学术进阶之路

刘子鸣的学术轨迹,始终围绕“用物理学思维破解AI难题”展开,从北大物理本科到MIT博士,再到即将入职清华,每一步都精准踩中“AI+科学”的交叉风口。

1. 竞赛起步:物理天赋奠定跨学科基础

出生于武汉的刘子鸣,早年间便是学界瞩目的“竞赛新星”。高中就读于武钢三中时,他投身物理竞赛,2015年以全国第8名的成绩入选物理国家集训队,凭借这一成绩被保送至北京大学物理学院。这段竞赛经历不仅培养了他严谨的逻辑思维,更让他早早领悟“用数学工具解决复杂系统问题”的方法论——这一能力后来成为他设计KAN架构的核心优势。

本科期间,刘子鸣已展现出跨学科研究潜力,在European Physical Journal C、Physical Review C等物理领域顶刊,以及NeurIPS 2020等AI顶会发表多篇一作论文,内容涵盖粒子物理与机器学习的交叉研究,为后续深耕“AI+科学”埋下伏笔。

2. MIT突破:复活60年数学定理,颠覆MLP架构

2021年,刘子鸣赴MIT物理系攻读博士,师从知名物理学家Max Tegmark(宇宙学专家,后转向AI研究)。彼时,AI领域正面临“模型性能与可解释性难以兼顾”的困境——以MLP为核心的深度学习模型虽精度高,却因“黑盒特性”无法解释决策逻辑,尤其在科学研究中难以辅助发现物理规律或数学定理。

刘子鸣将目光投向了1957年由数学家Andrey Kolmogorov和Vladimir Arnold提出的柯尔莫戈洛夫-阿诺德定理(Kolmogorov-Arnold Representation Theorem):该定理指出,“任何多元连续函数都可分解为有限个单变量函数的两层嵌套”。这一沉睡60余年的数学理论,被他视为破解“黑盒”的关键:

  • 重构神经网络逻辑:传统MLP在“节点”使用固定激活函数,“边”仅承载线性权重;而KAN将“可学习激活函数”转移到“边”上,用单变量样条函数替代线性权重,使每个变量的作用路径都能被直观观察;

  • 兼顾精度与可解释性:2024年4月,刘子鸣以一作身份发表KAN首篇论文,实验显示,在小尺度AI+科学任务中,更小参数量的KAN能实现优于MLP的精度,且可通过可视化交互辅助科学家发现规律——例如在凝聚态物理中,KAN成功推导出Anderson局域化的相变公式,而MLP仅能完成预测,无法输出物理规律。

这一突破迅速引发学界震动:论文发布3天内,GitHub仓库星标破1.1万,Google Scholar引用量如今已超3000次,约翰霍普金斯大学教授Alan Yuille评价其“为科学领域的AI应用打开了新大门”。2024年8月,刘子鸣团队又推出KAN 2.0,进一步优化模型效率,使其更适配工业场景。

二、清华新使命:三大研究方向锚定“AI+科学”前沿

根据清华官网公示及刘子鸣此前公开信息,他入职后将聚焦三大研究方向,延续“用科学思维重塑AI”的学术理念,同时推动技术落地。

1. Science for AI:用科学原理设计更高效的AI模型

这一方向旨在从数学、物理等基础学科中汲取灵感,突破现有AI架构的局限。刘子鸣团队此前提出的KAN,正是“Science for AI”的典型成果——基于柯尔莫戈洛夫-阿诺德定理设计网络结构,而非依赖经验性的参数调优。未来,他计划探索更多方向:

  • 可形变神经网络:让模型能根据任务需求动态调整结构,例如在处理图像分割时自动增加局部细节感知模块,处理物理模拟时强化全局规律捕捉能力;

  • 物理启发生成模型:借鉴热力学、流体力学等原理,解决现有生成模型(如GAN、Diffusion)在物理一致性上的缺陷,例如生成符合能量守恒定律的流体运动模拟结果。

2. Science of AI:用科学方法拆解AI“黑盒”

面对大模型“能力涌现却无法解释”的行业痛点,刘子鸣将带领团队用物理学、数学的严谨方法,解析AI模型的内在机制。他此前在“神经网络缩放律(Neural Scaling Law)”“Grokking现象(模型突然掌握规律的过程)”等领域的研究已取得突破,未来将进一步:

  • 建立大模型科学理论:量化分析模型参数量、数据量与能力之间的数学关系,为大模型训练提供理论指导,避免盲目堆参;

  • 探索机制可解释性:通过“玩具模型(Toy Models)”简化复杂网络,例如他近期在博客中持续更新的“稀疏注意力机制研究”,用小模型揭示大模型中注意力模块的工作原理,目前已发表多篇分析报告。

3. AI for Science:让AI成为科学发现的“协作伙伴”

这是刘子鸣最受关注的研究方向,核心是将KAN等可解释AI工具应用于基础科学研究,加速定理发现、实验设计等过程。此前,他的团队已通过KAN实现两大突破:

  • 数学领域:在纽结理论中,KAN不仅能预测纽结的拓扑属性(DeepMind的MLP也曾做到),还能输出属性间的关联公式,帮助数学家发现新规律;

  • 物理领域:在凝聚态物理中,KAN精准定位Anderson局域化的相变边界,并推导出描述该过程的解析表达式。

入职清华后,他计划与化学、生物、工程等领域的学者合作,针对“蛋白质结构预测”“新型材料设计”“天体物理模拟”等难题开发专用AI工具,让AI从“数据拟合工具”升级为“科学研究协作者”。

三、行业意义:顶尖人才回流,加速中国可解释AI发展

刘子鸣选择回国任教,不仅是个人学术生涯的新起点,更对中国AI科研格局产生多重影响,尤其在“可解释AI”这一关键赛道。

1. 填补国内研究空白,对标国际前沿

目前,全球可解释AI领域的核心成果多来自MIT、斯坦福等海外机构,国内虽有布局,但缺乏具有突破性的原创架构。刘子鸣带来的KAN技术及相关研究方法论,将直接填补这一空白——例如,KAN在科学发现中的应用经验,可帮助国内团队快速切入“AI+基础科学”领域,避免重复造轮子。

清华大学人工智能学院相关负责人表示,刘子鸣的加入“将强化学院在AI基础理论与交叉应用领域的优势,推动科研成果与国内产业需求结合”,例如与航天、材料等领域的企业合作,开发定制化的AI科研工具。

2. 培养跨学科人才,构建学术梯队

刘子鸣在2025年5月已启动博士生招生,首批学生将随他一同入职清华。他的培养理念强调“理论与实验结合”:既要求学生具备物理、数学的严谨思维,又需掌握工程化能力,例如用代码实现模型、设计实验验证理论。这种培养模式有望为国内输送更多“既懂科学又懂AI”的复合型人才,缓解跨学科领域的人才短缺问题。

他在招生中提到的“研究风格”也颇具特色:“好奇心驱动与影响力驱动并重,不盲目刷SOTA(当前最优结果),而是追求能同时带来科学启发和实际价值的成果”,这种理念或将影响更多年轻研究者跳出“指标竞赛”,聚焦更本质的科学问题。

3. 推动产学研融合,加速技术落地

尽管KAN目前仍以学术研究为主,但刘子鸣已开始探索商业化可能性。据了解,他与团队正与国内科研机构合作,将KAN应用于工业仿真、药物研发等场景——例如在汽车工程中,用KAN优化碰撞模拟算法,减少物理实验成本;在生物医药领域,辅助分析基因序列与疾病的关联,加速新药研发。

随着他入职清华,这类合作将进一步深化,依托高校的产学研平台,推动可解释AI从实验室走向产业界,为国内AI产业从“应用驱动”向“技术驱动”转型提供支撑。

四、个人治学:每天2小时“玩具模型”研究,坚持“物理视角看AI”

除了学术成果,刘子鸣的治学态度也备受关注。自2025年12月31日起,他每天在个人博客“Physics of AI”(用物理学研究AI)更新内容,聚焦“通过简单模型揭示复杂AI现象”:

  • 研究方式:每天投入2小时,用参数规模极小的“玩具模型”测试某个AI机制,例如“学习率如何影响归纳头(Induction Head)的涌现”“稀疏注意力的信息提取效率”等,已发表20余篇短文;

  • 核心观点:“AI研究不需要总是依赖大算力,大量小见解的积累,最终可能带来改变领域的突破”。这种“小而精”的研究风格,与当前行业追求“大模型、大算力”的趋势形成鲜明对比,也为资源有限的研究者提供了新思路。

正如他在博客中写道:“我的目标不是打造最强大的AI,而是理解AI为什么强大。只有理解了原理,才能让AI真正成为人类的工具,而非不可控的黑盒。”

结语:AI“黑盒”破解者的中国新征程

从MIT博士到清华助理教授,刘子鸣的归国之路,不仅是个人学术理想的延续,更折射出中国在AI基础研究领域的吸引力提升。他所开创的KAN架构,已证明“用科学原理设计AI”的可行性;而未来在清华的研究,或将进一步推动可解释AI从理论走向实践,为基础科学突破、产业技术升级提供新工具。

对于中国AI行业而言,刘子鸣的加入或许只是一个开始——随着更多顶尖人才回流,以及对“AI+科学”领域的持续投入,中国有望在可解释AI、AI for Science等前沿赛道实现“从跟跑到领跑”的跨越。而刘子鸣本人,也将以清华为新起点,继续用物理学的严谨与好奇心,拆解AI的“黑盒”,探索人工智能与基础科学融合的更多可能。

© 版权声明

相关文章