何恺明团队突破性创新!GeoPT范式让AI自学物理规律,最高省60%仿真数据

AI 资讯12小时前发布 dennis
0

物理仿真的规模化难题终于迎来新解法。2026年2月,MIT与清华大学联合团队(何恺明领衔)发布全新研究成果GeoPT,提出“动力学提升预训练”新范式,通过合成动力学将静态3D几何数据转化为动态训练资源,让模型在无真实物理标签的情况下自主习得物理直觉,在保证精度的前提下最高可节省60%的昂贵仿真数据,为流体力学、固体力学等多领域物理仿真提供了高效可扩展的新路径。

核心痛点突破:破解物理仿真的“数据困境”

当前数据驱动的神经网络仿真器虽已逐步替代传统数值求解器,但面临两大核心瓶颈。一方面,工业级精度的物理标签数据生成成本极高,一个CFD(计算流体力学)仿真样本往往需要数万CPU小时,严重限制了技术规模化应用;另一方面,互联网上海量的3D几何数据多为静态,仅对其进行掩码重建等常规预训练,会因缺失“动力学”维度导致模型无法捕捉物理核心特征,甚至出现“负迁移”问题。

GeoPT的创新之处在于找到了连接静态几何与动态物理的桥梁。研究团队发现,尽管真实物理标签稀缺,但“动力学”本身可通过参数化模拟——通过在预训练阶段引入“合成动力学”,为每个粒子随机采样速度构建合成速度场,将模型表征从单纯的几何空间提升至“几何+动力学”的联合空间。模型通过追踪几何特征在合成速度场中的轨迹演化,就能自主学习到物理演化的通用空间约束与耦合规律,无需依赖昂贵的真实物理标签。

技术架构解析:统一接口适配多场景仿真

GeoPT的训练流程设计兼具高效性与灵活性。预训练阶段,模型以ShapeNet-V1数据集中的汽车、飞机、船舶等万余个几何体为基础,每个几何体采样3.6万个追踪点,生成100个随机动力学场,最终构建出含100万个样本的5TB预训练数据集。其损失函数聚焦于预测合成动力学下的几何特征轨迹,通过优化的射线-三角形求交算法,处理单个样本仅需0.2秒,比工业级CFD仿真快10^7倍,80核CPU仅需3天即可完成数据集生成。

在下游任务适配方面,GeoPT采用统一接口设计:预训练时的随机速度在微调阶段可替换为编码特定仿真场景的任务速度。例如,空气动力学仿真中,将入射流速度、攻角等条件编码为对应速度向量;碰撞仿真中,让速度向量从冲击点随空间衰减,以模拟力的传播规律。这种设计让单个预训练模型可快速微调至流体力学、固体力学、辐射度仿真等多个领域,无需重构模型架构。

实验验证:数据效率与收敛速度双重提升

在多类物理仿真任务的测试中,GeoPT展现出显著优势。在汽车空气动力学、飞机受力分析、船舶水动力学、汽车碰撞应力仿真等场景中,GeoPT达到同等精度时可节省20%-60%的标注数据,其中船舶水动力学任务的数据集节省比例最高。同时,微调阶段的收敛速度比从零训练快2倍,部分任务甚至实现4倍加速。

更值得关注的是,GeoPT展现出“物理大模型”的规模化潜力:随着模型层数从8层提升至32层,以及预训练数据量的增加,其在各项任务中的性能持续稳步提升,验证了“大规模无标签几何+合成动力学自监督”路线的可行性。目前,该框架已开源,采用Transolver作为骨干网络,提供3M至15M参数的多尺寸模型供开发者选择。

行业影响:为物理仿真降本增效提供新范式

GeoPT的发布为物理仿真领域带来重要变革。传统物理仿真依赖海量算力与时间生成训练数据,而GeoPT通过自监督预训练大幅降低了对标注数据的依赖,有望推动AI仿真器在汽车制造、航空航天等工业领域的规模化应用。正如何恺明团队所强调的,该研究开辟了通用物理仿真基础模型的可扩展路径,为后续“物理大模型”的发展奠定了技术基础。

参与该研究的团队阵容汇集了跨机构力量,包括MIT CSAIL的博士后吴海旭、博士生宗逸礼,清华大学龙明盛教授,以及何恺明、Wojciech Matusik教授等知名学者。相关论文已在arXiv上线,代码与模型同步开源,有望引发行业对物理仿真预训练范式的进一步探索。未来,随着技术的迭代,GeoPT或将在更多工业场景中落地,为AI驱动的物理仿真提供更高效的解决方案。

© 版权声明

相关文章