3 月 20 日,全球权威大模型盲测榜单 LMArena 更新最新排名,阿里巴巴千问全新旗舰模型预览版 Qwen3.5-Max-Preview 首度登场便斩获 1464 分,一举超越 GPT5.4、Claude4.5 等海外顶级模型,以及豆包 2.0、GLM5、Kimi2.5 等一众国产模型,成功问鼎中国最强大模型。这一成绩不仅让阿里千问在全球大模型企业排名中跻身前五、坐稳中国第一,更标志着以千问为代表的中国大模型,在全球 AI 赛道的竞逐中实现了关键突破,中美两国已形成全球大模型第一梯队的双极格局。
作为由国际开源机构 LMSYS 打造的第三方测评平台,LMArena 以其公正权威的评测机制成为全球大模型性能的重要标尺。平台采用厂商自主提交模型、全球开发者匿名盲测的模式,通过模型两两 PK、开发者投票判定胜负,最终形成排名,最大程度规避了品牌偏见与针对性优化,其结果被业界视为最贴近真实用户体验的大模型能力参考。阿里千问早已是该榜单的常客,此次新模型的亮眼表现,更是再度为中国大模型正名。
此次亮相的 Qwen3.5-Max-Preview,是阿里千问 3.5 系列的旗舰预览版,而该系列自今年除夕发布以来,就展现出强劲的技术实力。千问 3.5 系列一举开源 8 款不同尺寸模型,均拿下同尺寸最佳性能 SOTA,其中 Qwen3.5-Plus 凭借 3970 亿总参数、仅 170 亿激活参数的设计实现 \"以小胜大\",性能超越两倍乃至三倍其参数量的知名模型,发布后便顺利闯入 LMArena 前 20,也让市场对旗舰版充满期待。
而 Qwen3.5-Max-Preview 也不负众望,交出了一份全面亮眼的成绩单:在考验模型核心能力的绝对胜率(无风格控制)全球总榜中位列第六;数学能力子榜单上跻身全球第五,拿下中国第一;专家级文本能力子榜单中同样位列全球第十、中国第一,较上一代千问 3 模型实现全方位性能提升。更值得期待的是,有消息透露 Qwen3.5-Max 正式版即将发布,其能力还将迎来进一步进化升级,有望持续刷新行业高度。
千问的突破并非孤例,此次 LMArena 榜单更折射出中国大模型产业的整体崛起。在基于企业最强模型的全球大模型公司排名中,中美两国各占据全球前十的五个席位,除阿里位列全球前五外,字节、智谱、月之暗面、百度也成功闯入前十,五家中国企业的集体上榜,打破了此前海外模型的垄断格局,彰显出中国大模型在技术研发、生态构建上的全面进步。
从参数竞赛到效率优先,从跟跑模仿到自主创新,中国大模型产业的发展路径清晰可见。阿里千问 3.5 系列以稀疏 MoE 架构实现了推理效率与成本的平衡,用技术创新走出了差异化发展道路;而从千问到豆包、GLM、Kimi,国产大模型形成了百花齐放的发展格局,在开源生态、垂直场景落地、技术架构创新等多个维度各有突破。
此次 Qwen3.5-Max-Preview 的惊艳表现,不仅是阿里千问技术积淀的成果,更是中国大模型产业发展的一个里程碑。它证明了中国企业已具备与全球顶尖科技巨头同台竞技的实力,而随着国产大模型在技术上的持续突破、在场景中的深度落地,全球 AI 产业的格局正被重新定义。未来,随着更多国产大模型的技术迭代与生态完善,中国大模型必将在全球 AI 发展中扮演更重要的角色,为人工智能的全球发展贡献中国智慧与中国方案。