国产算力撑起推理巅峰!讯飞星火X2重磅发布 行业场景全面落地

AI 资讯2分钟前发布 dennis
0

【量子位 2026年2月11日讯】国产大模型赛道再添硬核力量!科大讯飞正式推出星火大模型X2,仅用3个月时间实现推理性能50%的跨越式提升,成为国内主流大模型中唯一基于全国产算力训练的通用大模型。其通用能力比肩GPT-5.2、Gemini-3-Pro等国际顶尖模型,同时以”通用底座+行业专才”双轮驱动,在医疗、教育、汽车等核心场景实现深度落地,百万tokens最高仅需3元的成本优势,进一步降低了行业级AI应用的门槛。

通用能力跻身第一梯队 国产算力跑出国际水准

星火X2延续了293B参数的MoE稀疏架构,通过四大核心技术创新实现性能突破:训推采样校准强化学习算法解决了MoE架构训推不一致的行业痛点,确保模型训练效果与实际推理表现一致;递归式高难数据合成方法生成高质量深度推理语料,大幅提升模型逻辑推导能力;多阶段RL高吞吐采样方案将推理过程拆分为Prefill与Decoding两阶段,使国产算力平台训练效率提升10%;服务高性能部署优化算法则通过轻量化压缩实现单机大EP并行部署,让模型兼顾高效推理与轻量化落地。

权威基准测试数据印证了其硬实力:在MMLU Pro评测中,星火X2以87.3分的成绩位居国产模型首位,与GPT-5.2持平;AIME 2025数学竞赛测试中斩获95.7分,仅次于GPT-5.2;在语言理解、知识问答、多语言等核心维度,均稳居国产第一梯队,与国际顶尖模型差距进一步缩小。实测中,其成功破解哈佛-麻省理工数学锦标赛(HMMT)高难度英文题目,精准给出解题步骤与答案,同时流畅完成西班牙语复杂问题解答,展现出130多种语言的综合处理能力。

行业场景深度渗透 四大领域实现标杆突破

星火X2将升级重点聚焦场景落地,依托”算法优化+垂域数据+专家参与”三位一体模式,在医疗、教育、汽车、智能体四大领域实现突破性进展:

  • 医疗领域:星火医疗大模型在智能健康分析、辅助诊疗、智能用药审核等场景的核心指标均领先行业,其中用药审核准确率达94.1%,显著优于GPT-5.2的87.1%。C端产品”讯飞晓医”APP同步升级,多轮主动问诊诊断合理率达93.9%,拍药盒问用药解答率80.7%,已通过国内首个医疗大模型专项评测,成为合规化落地的标杆。

  • 教育领域:创新推出错因贯穿的个性化学习能力,数学解答题步骤批改F1值达88.3%,错因分析正确率85.8%,远超同类模型。通过苏格拉底式启发教学,引导学生自主拆解思维过程,配套AI学习机实现1对1精准辅导,在个性化答疑、学习方案规划等场景形成差异化优势。

  • 汽车领域:针对智能座舱交互痛点,实现模糊意图理解的跨越式突破,交互成功率达84%,远超行业平均水平。用户说出”我有点冷””风太大”等自然语言指令时,系统可精准识别需求并执行操作,彻底告别传统交互的指令束缚。

  • 智能体领域:星辰Agent平台整合百余种能力,集成超130万个智能体,招采智能体等核心场景效率提升超3倍。支持分钟级定制专用智能体,长时复杂任务规划、多工具组合调用能力显著提升,在Tau2-bench评测中领跑国产模型。

国产化自主可控 场景为王开辟差异化路径

星火X2的发布,标志着国产大模型在算力受限环境下实现了关键突破。作为唯一基于全国产算力训练的主流通用大模型,其实现了算力与技术的双重自主可控,验证了讯飞”1+N”战略的可行性——以1个通用底座大模型赋能N个行业大模型,通过软硬一体化实现快速落地转化。

在政务、能源、通信等行业招投标中,讯飞星火已取得多项第一:政务领域中标数量与金额双第一,能源领域中标数量与金额均居首位,医疗、通信等领域也稳居行业前列,落地场景覆盖城市治理、智能招投标、临床诊疗等关键领域。目前,讯飞开放平台已上线星火X2 API,新注册开发者可领取100万Tokens免费额度,网页版与APP 5.2.0新版本同步开放体验。

业内专家指出,星火X2的突破不仅在于性能提升,更在于走出了一条”底座自主、硬件协同、场景为王”的差异化路径。在国产大模型步入应用红利期的当下,其以行业深度落地为核心的发展模式,为AI技术规模化赋能实体经济提供了可参考的范本,也推动国产大模型从技术竞争迈向价值创造的新阶段。

© 版权声明

相关文章