国产算力撑起推理巅峰！讯飞星火X2重磅发布行业场景全面落地

0 0

【量子位 2026年2月11日讯】国产大模型赛道再添硬核力量！科大讯飞正式推出星火大模型X2，仅用3个月时间实现推理性能50%的跨越式提升，成为国内主流大模型中唯一基于全国产算力训练的通用大模型。其通用能力比肩GPT-5.2、Gemini-3-Pro等国际顶尖模型，同时以”通用底座+行业专才”双轮驱动，在医疗、教育、汽车等核心场景实现深度落地，百万tokens最高仅需3元的成本优势，进一步降低了行业级AI应用的门槛。

通用能力跻身第一梯队国产算力跑出国际水准

星火X2延续了293B参数的MoE稀疏架构，通过四大核心技术创新实现性能突破：训推采样校准强化学习算法解决了MoE架构训推不一致的行业痛点，确保模型训练效果与实际推理表现一致；递归式高难数据合成方法生成高质量深度推理语料，大幅提升模型逻辑推导能力；多阶段RL高吞吐采样方案将推理过程拆分为Prefill与Decoding两阶段，使国产算力平台训练效率提升10%；服务高性能部署优化算法则通过轻量化压缩实现单机大EP并行部署，让模型兼顾高效推理与轻量化落地。

权威基准测试数据印证了其硬实力：在MMLU Pro评测中，星火X2以87.3分的成绩位居国产模型首位，与GPT-5.2持平；AIME 2025数学竞赛测试中斩获95.7分，仅次于GPT-5.2；在语言理解、知识问答、多语言等核心维度，均稳居国产第一梯队，与国际顶尖模型差距进一步缩小。实测中，其成功破解哈佛-麻省理工数学锦标赛（HMMT）高难度英文题目，精准给出解题步骤与答案，同时流畅完成西班牙语复杂问题解答，展现出130多种语言的综合处理能力。

行业场景深度渗透四大领域实现标杆突破

星火X2将升级重点聚焦场景落地，依托”算法优化+垂域数据+专家参与”三位一体模式，在医疗、教育、汽车、智能体四大领域实现突破性进展：

医疗领域：星火医疗大模型在智能健康分析、辅助诊疗、智能用药审核等场景的核心指标均领先行业，其中用药审核准确率达94.1%，显著优于GPT-5.2的87.1%。C端产品”讯飞晓医”APP同步升级，多轮主动问诊诊断合理率达93.9%，拍药盒问用药解答率80.7%，已通过国内首个医疗大模型专项评测，成为合规化落地的标杆。
教育领域：创新推出错因贯穿的个性化学习能力，数学解答题步骤批改F1值达88.3%，错因分析正确率85.8%，远超同类模型。通过苏格拉底式启发教学，引导学生自主拆解思维过程，配套AI学习机实现1对1精准辅导，在个性化答疑、学习方案规划等场景形成差异化优势。
汽车领域：针对智能座舱交互痛点，实现模糊意图理解的跨越式突破，交互成功率达84%，远超行业平均水平。用户说出”我有点冷””风太大”等自然语言指令时，系统可精准识别需求并执行操作，彻底告别传统交互的指令束缚。
智能体领域：星辰Agent平台整合百余种能力，集成超130万个智能体，招采智能体等核心场景效率提升超3倍。支持分钟级定制专用智能体，长时复杂任务规划、多工具组合调用能力显著提升，在Tau2-bench评测中领跑国产模型。

国产化自主可控场景为王开辟差异化路径

星火X2的发布，标志着国产大模型在算力受限环境下实现了关键突破。作为唯一基于全国产算力训练的主流通用大模型，其实现了算力与技术的双重自主可控，验证了讯飞”1+N”战略的可行性——以1个通用底座大模型赋能N个行业大模型，通过软硬一体化实现快速落地转化。

在政务、能源、通信等行业招投标中，讯飞星火已取得多项第一：政务领域中标数量与金额双第一，能源领域中标数量与金额均居首位，医疗、通信等领域也稳居行业前列，落地场景覆盖城市治理、智能招投标、临床诊疗等关键领域。目前，讯飞开放平台已上线星火X2 API，新注册开发者可领取100万Tokens免费额度，网页版与APP 5.2.0新版本同步开放体验。

业内专家指出，星火X2的突破不仅在于性能提升，更在于走出了一条”底座自主、硬件协同、场景为王”的差异化路径。在国产大模型步入应用红利期的当下，其以行业深度落地为核心的发展模式，为AI技术规模化赋能实体经济提供了可参考的范本，也推动国产大模型从技术竞争迈向价值创造的新阶段。

# AI 资讯