【量子位 2025年12月23日讯】距离叩响港交所大门仅剩最后百米,中国大模型头部企业智谱AI突然放出“技术大招”。12月23日凌晨,智谱正式发布新一代开源旗舰模型GLM-4.7,在编码、复杂推理、工具协同三大核心维度实现突破性升级,不仅在SWE-bench Verified等权威编程基准测试中创下开源新高,更在AIME 25、HLE等数学推理榜单中超越GPT-5.1,为即将到来的“全球大模型第一股”上市敲钟注入重磅技术背书。
此次GLM-4.7的发布堪称“精准卡点”——就在一周前,智谱刚通过港交所上市聆讯,招股书披露其累计研发投入超44亿元、服务全球1.2万家企业客户,而新模型的技术突破,恰好印证了其“研发驱动增长”的核心逻辑。目前,GLM-4.7已在Hugging Face开源权重,同时通过z.ai官网、BigModel.cn开放API调用,开发者可直接体验“写植物大战僵尸游戏代码”“生成3D交互页面”等复杂任务。
编程能力封神:SWE-bench分数破73%,碾压开源竞品
GLM-4.7最核心的升级集中在编程领域,官方技术报告用“Coding, Coding,还是Coding”强调其战略重心,实测数据更凸显其“开源编程王者”地位:
-
基准测试全面霸榜:在衡量真实软件工程能力的SWE-bench Verified基准中,GLM-4.7得分达73.8%,较前代GLM-4.6提升5.8个百分点,不仅刷新开源模型纪录,更逼近闭源模型Anthropic Claude Sonnet 4.5(77.2%);在多语言编程测试SWE-bench Multilingual中,分数飙升12.9个百分点至66.7%,支持Python、Java、Go等15种主流编程语言的复杂项目开发。
-
实战能力惊艳:官方Demo显示,GLM-4.7可独立完成“植物大战僵尸游戏”的完整代码开发,包括滚动商店、阳光经济系统、僵尸与植物战斗逻辑等核心模块,生成的代码支持本地资源调用(含GIF动效),且能实现鼠标追踪铲子移除植物等交互功能,无需人工二次修改即可稳定运行。
-
终端任务效率翻倍:针对开发者高频使用的终端操作场景,GLM-4.7在Terminal Bench 2.0基准中得分41.0%,较GLM-4.6(24.5%)提升16.5个百分点,可自主完成服务器部署、数据备份、环境配置等复杂终端指令序列,支持“先思考再行动”的分步决策模式,减少操作失误率。
推理与工具协同升级:HLE分数超GPT-5.1,新增三大思考模式
除编程能力外,GLM-4.7在复杂推理与工具使用维度也实现跨越式提升,尤其在数学推理和长程任务规划上表现突出:
-
数学推理超越GPT-5.1:在面向高阶数学能力的AIME 25基准测试中,GLM-4.7以95.7分超越GPT-5.1(94.0分);在模拟人类综合能力评估的HLE(人类最后考试)基准中,分数达24.8分,若启用工具辅助则飙升至42.8分,较GLM-4.6提升12.4个百分点,可解决微积分、线性代数、物理动力学等跨学科复杂问题。
-
三大创新思考模式落地:为提升长程任务处理能力,GLM-4.7强化并新增三类思考机制:一是“交错式思考”,可在工具调用间隙持续解读输出结果,串联多步骤推理;二是“保留式思考”,在多回合对话中自动复用历史推理过程,避免信息丢失,节省50%以上的token消耗;三是“轮级思考”,支持用户按会话轮次开启/关闭深度推理,轻量任务快速响应,复杂任务精准求解。
-
工具调用效率显著提升:在网页浏览基准BrowseComp中,GLM-4.7得分52.0分(+6.9%),若启用上下文管理功能则达67.5分(+10.0%),可自主完成信息检索、表格提取、多页面内容整合等操作;在τ²-Bench工具链管理测试中,分数提升12.2个百分点至87.4分,支持API调用、数据库查询、第三方服务集成的端到端协同。
多模态与交互体验优化:3D资产生成更精细,PPT设计更专业
GLM-4.7在非编程场景的表现同样亮眼,尤其在多模态内容生成和交互体验上,较前代模型有明显改观:
-
前端与视觉生成升级:生成网页UI时,GLM-4.7可构建更清晰的组件层级和现代风格界面,支持响应式布局;设计PPT时,标题层级分明、元素尺寸比例合理,例如“巴黎旅游介绍”主题PPT中,自动生成的索引页、景点介绍页逻辑连贯,配图建议精准;在3D资产生成上,可创建细节更丰富的场景(如京都像素花园),模型结构一致性较GLM-4.6提升30%。
-
对话与创作能力增强:在日常聊天、创意写作、角色扮演场景中,GLM-4.7的语言流畅度和语境理解能力显著提升,支持多轮对话中的风格一致性保持,例如在“科幻小说创作”任务中,可连续生成符合设定世界观的情节,人物对话逻辑连贯,场景描写生动。
IPO前夜的技术宣言:低价策略+开源生态,巩固行业地位
智谱选择在IPO冲刺阶段发布GLM-4.7,不仅是技术实力的展示,更暗含其抢占市场份额的战略意图:
-
低价套餐降低使用门槛:同步推出“GLM Coding Plan”节日优惠,12月8日至1月15日期间首购立减50%,叠加节日限定优惠后,每月最低20元即可畅享模型服务,用量达Claude Code套餐的3倍,大幅降低开发者和中小企业的使用成本。
-
开源生态持续扩张:GLM-4.7的开源权重已上线Hugging Face,开发者可免费下载微调,结合此前开源的GLM-4.6V多模态模型、AutoGLM智能体模型,智谱已构建覆盖“语言-代码-多模态-智能体”的完整开源体系,进一步巩固其在开发者社区的影响力。
-
技术背书支撑IPO估值:据招股书披露,智谱2022-2024年营收年复合增长率达130%,毛利率稳定在50%以上,此次GLM-4.7的技术突破,将进一步验证其“研发投入→技术迭代→商业变现”的闭环能力,为上市后的估值提供有力支撑。
业内人士分析,智谱在IPO前发布GLM-4.7,既是向资本市场证明其技术领先性,也是应对全球大模型竞争的重要布局。随着GLM-4.7的开源与落地,中国大模型企业在编程领域的全球竞争力将进一步提升,而智谱也有望凭借这一“技术王牌”,在即将到来的上市敲钟后开启新增长曲线。