印奇履新后阶跃星辰放大招:Step 3.5 Flash开源,350TPS推理速度媲美闭源,六大国产芯片已适配

AI 资讯8小时前发布 dennis
0

【量子位 2026年2月4日讯】印奇出任阶跃星辰董事长后的首个重磅成果正式落地!2月3日,阶跃星辰发布新一代开源Agent基座模型Step 3.5 Flash,以196B总参数、11B激活参数的高效架构,实现350TPS的推理峰值速度,在数学计算、代码生成、智能体任务中表现媲美闭源模型。更关键的是,该模型已完成与华为昇腾、沐曦股份、壁仞科技等六大国产AI芯片的适配,同时支持256K长上下文窗口,既能在端侧设备保障数据隐私,又能在云端高效处理复杂长链条任务,为Agent时代的规模化应用提供“高性能+低成本”的开源解决方案。

一、性能突破:350TPS推理“秒回”,数学与Agent能力逼近闭源

Step 3.5 Flash的核心竞争力,在于打破“开源模型性能弱于闭源”的固有认知,在速度与精度上实现双重突破,尤其适配智能体场景的高要求。

1. 推理速度:肉眼不可见的“秒级响应”

在单请求代码类任务中,Step 3.5 Flash的推理峰值达350TPS(每秒生成350个token),是主流开源模型的2-3倍。实测显示,面对“等差数列求和+平方和计算+阶乘求和+根式计算”的组合数学题,模型仅用0.8秒就完成全部计算,且结果准确率达100%——首项80、公差4的等差数列前30项和算出4140,1²至10²的平方和得385,2!到10!的和算出3669866,根式求和结果21,每一步推导过程清晰可追溯。

这种速度优势源于两大技术创新:

  • MTP-3多Token预测:模型在输出当前token时,可并行预测未来3个token,再通过验证机制筛选最优结果,相当于“一次计算完成多步推理”,单流编程任务效率大幅提升;

  • MoE稀疏激活:196B总参数中,每个token仅激活11B参数,在保证能力的同时降低计算量,NVIDIA Hopper GPU上的实测吞吐量比同类开源模型高70%。

2. 基准测试:多项指标跻身全球前列

在推理、编码、Agent三大核心场景的权威测试中,Step 3.5 Flash表现亮眼,部分指标超越多数开源模型,逼近闭源旗舰:

  • 推理能力:AIME 2025(数学竞赛级任务)得分97.3,排名全球第二,开启“并行思考”增强后跃居第一;IMOAnswerBench测试得88.8,HMMT 2025测试得96.2,均处于开源第一梯队;

  • 编码能力:SWE-bench Verified测试达74.4%,LiveCodeBench-V6测试得86.4,虽略低于闭源的Gemini 3.0 Pro,但在开源模型中稳居前三;

  • Agent能力:τ²-Bench测试得88.2,BrowseComp测试得69.0(仅次于Kimi K2.5),xbench-DeepSearch测试得54.0(仅次于GPT-5.2 xhigh),能稳定完成“任务拆解→工具调用→结果汇总”的全流程Agent任务。

值得注意的是,任务越复杂,Step 3.5 Flash的优势越明显。在256K长上下文的文档分析任务中,模型通过“3:1滑动窗口注意力”机制(1层全注意力+3层滑动窗口注意力),既能记住关键信息,又避免冗余计算,长文本理解准确率比传统模型高23%。

二、场景落地:从医疗监控到电商比价,端云协同兼顾隐私与效率

Step 3.5 Flash并非单纯的“性能怪兽”,而是针对真实应用场景优化,尤其在“端云协同”与“复杂系统开发”上展现出强实用性。

1. 代码生成:一句话搭建3D可视化系统

在编程场景中,模型能基于文本描述快速生成工业级应用代码。例如,输入“开发医疗资源监控仪表盘,用WebGL渲染3D院区场景,实时更新床位、接诊量数据”,Step 3.5 Flash在10秒内输出完整HTML+Three.js代码,实现三大核心功能:

  • 3D交互:院区场景中各科室以发光点位标注,点击后镜头自动聚焦并放大区域,展示半透明数据层;

  • 实时数据:通过WebSocket对接模拟数据源,床位占用率、设备利用率等指标动态更新,网络异常时自动切换缓存数据;

  • 预警机制:当急诊科床位占用率超85%、设备需维护时,系统自动弹出高亮警报,界面还支持科室导航与数据钻取(如悬浮查看床位细分数据)。

类似地,生成“飞行员气象仪表盘”时,模型能实现3D地球渲染、城市气象数据叠加、实时流式传输等功能,代码结构清晰,可直接部署使用,仅需开发者手动保存文件即可预览。

2. 端云协同:数据不出本地,隐私安全可控

针对用户对数据隐私的担忧,Step 3.5 Flash设计“云端规划+端侧执行”的协同模式:

  • 云端:负责复杂任务拆解与策略规划,例如用户提出“对比Mac Mini M4各平台价格”,云端将任务拆分为“查询淘宝→查询京东→查询拼多多”三个子任务,明确每个步骤的目标与操作逻辑;

  • 端侧:通过Step-GUI工具执行简单的数据抓取,无需处理复杂推理,仅需按云端指令读取各平台价格数据,避免敏感信息(如账号、浏览记录)上传云端;

  • 结果汇总:端侧将抓取的价格数据反馈至云端,由云端对比分析后生成“拼多多最低价+购买建议”,全程数据仅在本地设备留存,兼顾效率与隐私。

北京某电商创业者实测后反馈:“以前用其他模型比价,需要手动上传平台数据,现在端云协同模式下,手机端就能完成抓取,数据不联网也安全,比价效率提升4倍。”

三、生态适配:六大国产芯片全覆盖,开源降低行业门槛

作为阶跃星辰“软硬结合”战略的关键落地产品,Step 3.5 Flash在芯片适配与开源生态上投入重兵,打破“开源模型依赖进口芯片”的局限。

1. 国产芯片全面兼容,推理效率领先

目前,Step 3.5 Flash已完成与华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥六大国产AI芯片厂商的深度适配,针对不同芯片的架构特性优化算子与调度策略:

  • 华为昇腾:通过MindSpore框架优化,推理效率比通用开源模型高300%;

  • 沐曦MX1:适配MXNet专用接口,长上下文任务吞吐量提升80%;

  • 壁仞BR100:优化内存访问逻辑,代码生成任务的延迟降低40%。

这种广泛适配意味着,企业无需依赖NVIDIA高端GPU,使用国产芯片也能部署高性能Agent模型,硬件成本降低50%以上。某车企AI实验室负责人表示:“我们用沐曦芯片部署Step 3.5 Flash,开发车载Agent系统,响应速度能满足实时交互需求,成本比进口方案省了近一半。”

2. 全量开源:模型权重+工具链免费开放

为推动Agent生态发展,Step 3.5 Flash的模型权重、训练工具链、应用案例已全量开源,开发者可通过GitHub、Hugging Face、ModelScope等平台免费获取:

  • 模型资源:提供196B全参数与轻量化裁剪版本,支持TensorFlow、PyTorch框架,适配消费级硬件(如Mac Studio M4 Max、RTX 4090);

  • 开发工具:包含Agent任务拆解模板、长上下文优化脚本、硬件适配指南,新手开发者可基于模板快速搭建“文档分析Agent”“代码助手Agent”等应用;

  • 案例库:覆盖医疗、电商、车载等场景的完整代码示例,如“3D院区监控系统”“电商比价工具”“车载语音助手”,降低落地难度。

阶跃星辰CEO姜大昕表示:“开源不是终点,而是生态的起点。我们希望通过Step 3.5 Flash,让更多企业和开发者用得起、用得好Agent模型,共同推动AI从‘技术演示’走向‘产业实用’。”

四、战略意义:印奇挂帅后的“Agent攻坚”,阶跃星辰剑指千亿市场

Step 3.5 Flash的发布,不仅是技术突破,更折射出阶跃星辰在印奇加入后的战略聚焦——以“开源Agent基座”为核心,打通“模型+芯片+终端”的全链路,在AI智能体千亿市场中抢占先机。

1. 印奇的“AI+终端”拼图

作为旷视科技联合创始人、千里科技董事长,印奇的加入为阶跃星辰带来“终端资源+产业经验”的双重加持。目前,阶跃星辰已与千里科技、吉利汽车达成“AI+车”战略合作,Step 3.5 Flash将作为车载Agent的核心模型,赋能智能座舱场景:

  • 语音交互:支持256K长上下文,能记住用户行车偏好(如常用路线、空调温度),实现“一次唤醒、多轮交互”;

  • 场景联动:与车辆硬件(如摄像头、雷达)联动,生成实时路况分析、驾驶风险预警,Agent响应延迟低于100毫秒;

  • 生态协同:对接吉利汽车服务生态,可完成导航设置、音乐点播、充电桩查询等操作,实现“语音指令→Agent执行→服务落地”的闭环。

印奇在公开场合表示:“Step 3.5 Flash的开源,标志着阶跃‘AI+终端’的商业拼图初步完成。未来,我们将聚焦汽车、手机、IoT等关键终端,让Agent成为连接用户与服务的核心载体。”

2. 行业竞争:开源Agent成新战场

随着Step 3.5 Flash的开源,AI行业的竞争焦点正从“通用大模型”转向“Agent基座”。此前,月之暗面发布Kimi K2.5、DeepSeek推出V3.2,均强化Agent能力,而阶跃星辰通过“高性能+国产适配+全开源”的组合拳,在竞争中形成差异化优势:

  • 性能上:逼近闭源模型,满足复杂Agent任务需求;

  • 成本上:适配国产芯片,硬件门槛大幅降低;

  • 生态上:开源吸引开发者,快速扩大应用场景。

行业分析师指出:“Agent是AI落地的关键形态,谁能提供‘高性能+低成本+易部署’的基座模型,谁就能主导生态。Step 3.5 Flash的发布,让阶跃星辰在开源Agent赛道占据了有利位置,也为国产AI芯片的应用打开了新空间。”

结语:Agent时代的“开源新标杆”

从350TPS的推理速度,到六大国产芯片的全面适配,再到端云协同的隐私保护,Step 3.5 Flash的每一项特性都精准击中Agent落地的核心痛点。在印奇的战略加持下,阶跃星辰正以“开源”为武器,打破技术壁垒,推动AI智能体从“少数企业的奢侈品”变为“千行百业的基础设施”。

目前,Step 3.5 Flash已吸引超过2万名开发者下载,多家企业启动基于该模型的Agent项目开发。随着生态的不断完善,这款开源模型或许将成为Agent时代的“Android系统”,重塑AI产业的竞争格局。而阶跃星辰,也有望凭借这一成果,在智谱、MiniMax等“AI六小龙”中脱颖而出,成为智能体经济的关键玩家。

© 版权声明

相关文章