2025 年 11 月 23 日,在 2025 IDEA 大会上,IDEA 研究院(粤港澳大湾区数字经济研究院)创院理事长沈向洋首次系统性解读 AI 演进五大核心维度,为行业提供技术创新与商业落地的思考框架。同期,研究院集中发布 “万物可抓取” DINO-X Grasp 模型、AI 原生编程语言 MoonBit、GPU 渲染器 Smaray 三大重磅成果,覆盖具身智能、开发者工具、影视工业等关键领域,其中 Smaray 更是打破国外在高端渲染市场的长期垄断。
沈向洋提出的 AI 演进五维框架,从算法范式、智能载体、交互范式、计算架构、数据五个维度梳理行业发展脉络。在算法范式上,AI 已从监督学习、强化学习逐步迈向自主学习阶段,持续探索高层认知能力;智能载体正从抽象符号空间转向物理空间,聚焦世界模型与具身模型的落地;交互范式历经命令行、图形界面等多次迭代,如今正向 AI 主动提议、主动执行的高阶自然交互演进;计算架构呈现 “通用到专用、单一到多元” 的趋势,专用芯片成为平衡性能、成本与能效的关键;数据则从静态教材、动态反馈,升级为 AI 验证假设的证据,合成数据与主动探索数据成为新方向。沈向洋强调,AI 领域的机会不仅源于技术本身,更在于理解技术对载体、交互、计算与数据的重构作用。
在具身智能领域,IDEA 研究院发布 “万物可抓取” DINO-X Grasp 模型,攻克传统 VLA(视觉 – 语言 – 动作)大模型泛化能力不足、抓取操作不精准的痛点。该模型基于强泛化视觉检测模型 DINO-X 升级而来,实现从 2D 感知到 3D 理解的跨越,能精准识别物体、预测抓取点位并还原三维结构,指导机械臂完成稳定操作。其优势在于兼容性强,可适配英特尔深度相机、X-ARM 机械臂等主流设备,支持移动端与端侧运行,在普通 4090 显卡上能达到 10 帧 / 秒的实时推理速度。目前,该模型已应用于招商局集团港口验残、桥梁检测等场景,并与美团机器人研究院达成合作。
AI 原生编程语言 MoonBit 则展现出中国开发者工具的突围实力。这款由张宏波团队打造的语言,是全球首个原生集成 AI 助手的编程语言,配套基于语义分析的专属 IDE,在数字计算基准测试中性能超 Java 近 10 倍,WebAssembly 后端代码体积比 Rust 小 30%。成立仅两年多,MoonBit 用户已从 2.6 万增长至 10 万,吸引北美云厂商等商业付费客户,预计 2026 年底用户将突破 100 万。据悉,支持多语言的智能体平台 MoonBit Agent SDK 将于 12 月 18 日正式开源,进一步完善开发者生态。
历时五年研发的 GPU 渲染器 Smaray,成为影视工业领域的 “破局者”。此前,全球高端渲染市场被美国 Arnold、皮克斯 Renderman、欧洲 V-Ray 垄断,国产大片多依赖进口工具。Smaray 实现技术突破,支持英伟达、AMD、国产 GPU 及苹果芯片,将原本需数分钟的渲染任务压缩至数秒完成,且支持实时交互探索场景。目前,《流浪地球》特效制作方 MoreVFX、《哪吒》制作方光线动画等已率先采用该渲染器,标志着国产渲染技术正式跻身国际一流水平。
此次 IDEA 研究院的成果发布与理论框架分享,既展现了中国在 AI 核心技术领域的创新实力,也为行业提供了从技术研发到商业落地的清晰路径,有望推动具身智能、开发者工具、影视工业等领域的国产化升级与全球化竞争。