智谱IPO冲刺前夜放大招：GLM-4.7开源登顶编程SOTA，多维度能力碾压前代

0 0

【量子位 2025年12月23日讯】距离叩响港交所大门仅剩最后百米，中国大模型头部企业智谱AI突然放出“技术大招”。12月23日凌晨，智谱正式发布新一代开源旗舰模型GLM-4.7，在编码、复杂推理、工具协同三大核心维度实现突破性升级，不仅在SWE-bench Verified等权威编程基准测试中创下开源新高，更在AIME 25、HLE等数学推理榜单中超越GPT-5.1，为即将到来的“全球大模型第一股”上市敲钟注入重磅技术背书。

此次GLM-4.7的发布堪称“精准卡点”——就在一周前，智谱刚通过港交所上市聆讯，招股书披露其累计研发投入超44亿元、服务全球1.2万家企业客户，而新模型的技术突破，恰好印证了其“研发驱动增长”的核心逻辑。目前，GLM-4.7已在Hugging Face开源权重，同时通过z.ai官网、BigModel.cn开放API调用，开发者可直接体验“写植物大战僵尸游戏代码”“生成3D交互页面”等复杂任务。

编程能力封神：SWE-bench分数破73%，碾压开源竞品

GLM-4.7最核心的升级集中在编程领域，官方技术报告用“Coding, Coding,还是Coding”强调其战略重心，实测数据更凸显其“开源编程王者”地位：

基准测试全面霸榜：在衡量真实软件工程能力的SWE-bench Verified基准中，GLM-4.7得分达73.8%，较前代GLM-4.6提升5.8个百分点，不仅刷新开源模型纪录，更逼近闭源模型Anthropic Claude Sonnet 4.5（77.2%）；在多语言编程测试SWE-bench Multilingual中，分数飙升12.9个百分点至66.7%，支持Python、Java、Go等15种主流编程语言的复杂项目开发。
实战能力惊艳：官方Demo显示，GLM-4.7可独立完成“植物大战僵尸游戏”的完整代码开发，包括滚动商店、阳光经济系统、僵尸与植物战斗逻辑等核心模块，生成的代码支持本地资源调用（含GIF动效），且能实现鼠标追踪铲子移除植物等交互功能，无需人工二次修改即可稳定运行。
终端任务效率翻倍：针对开发者高频使用的终端操作场景，GLM-4.7在Terminal Bench 2.0基准中得分41.0%，较GLM-4.6（24.5%）提升16.5个百分点，可自主完成服务器部署、数据备份、环境配置等复杂终端指令序列，支持“先思考再行动”的分步决策模式，减少操作失误率。

推理与工具协同升级：HLE分数超GPT-5.1，新增三大思考模式

除编程能力外，GLM-4.7在复杂推理与工具使用维度也实现跨越式提升，尤其在数学推理和长程任务规划上表现突出：

数学推理超越GPT-5.1：在面向高阶数学能力的AIME 25基准测试中，GLM-4.7以95.7分超越GPT-5.1（94.0分）；在模拟人类综合能力评估的HLE（人类最后考试）基准中，分数达24.8分，若启用工具辅助则飙升至42.8分，较GLM-4.6提升12.4个百分点，可解决微积分、线性代数、物理动力学等跨学科复杂问题。
三大创新思考模式落地：为提升长程任务处理能力，GLM-4.7强化并新增三类思考机制：一是“交错式思考”，可在工具调用间隙持续解读输出结果，串联多步骤推理；二是“保留式思考”，在多回合对话中自动复用历史推理过程，避免信息丢失，节省50%以上的token消耗；三是“轮级思考”，支持用户按会话轮次开启/关闭深度推理，轻量任务快速响应，复杂任务精准求解。
工具调用效率显著提升：在网页浏览基准BrowseComp中，GLM-4.7得分52.0分（+6.9%），若启用上下文管理功能则达67.5分（+10.0%），可自主完成信息检索、表格提取、多页面内容整合等操作；在τ²-Bench工具链管理测试中，分数提升12.2个百分点至87.4分，支持API调用、数据库查询、第三方服务集成的端到端协同。

多模态与交互体验优化：3D资产生成更精细，PPT设计更专业

GLM-4.7在非编程场景的表现同样亮眼，尤其在多模态内容生成和交互体验上，较前代模型有明显改观：

前端与视觉生成升级：生成网页UI时，GLM-4.7可构建更清晰的组件层级和现代风格界面，支持响应式布局；设计PPT时，标题层级分明、元素尺寸比例合理，例如“巴黎旅游介绍”主题PPT中，自动生成的索引页、景点介绍页逻辑连贯，配图建议精准；在3D资产生成上，可创建细节更丰富的场景（如京都像素花园），模型结构一致性较GLM-4.6提升30%。
对话与创作能力增强：在日常聊天、创意写作、角色扮演场景中，GLM-4.7的语言流畅度和语境理解能力显著提升，支持多轮对话中的风格一致性保持，例如在“科幻小说创作”任务中，可连续生成符合设定世界观的情节，人物对话逻辑连贯，场景描写生动。

IPO前夜的技术宣言：低价策略+开源生态，巩固行业地位

智谱选择在IPO冲刺阶段发布GLM-4.7，不仅是技术实力的展示，更暗含其抢占市场份额的战略意图：

低价套餐降低使用门槛：同步推出“GLM Coding Plan”节日优惠，12月8日至1月15日期间首购立减50%，叠加节日限定优惠后，每月最低20元即可畅享模型服务，用量达Claude Code套餐的3倍，大幅降低开发者和中小企业的使用成本。
开源生态持续扩张：GLM-4.7的开源权重已上线Hugging Face，开发者可免费下载微调，结合此前开源的GLM-4.6V多模态模型、AutoGLM智能体模型，智谱已构建覆盖“语言-代码-多模态-智能体”的完整开源体系，进一步巩固其在开发者社区的影响力。
技术背书支撑IPO估值：据招股书披露，智谱2022-2024年营收年复合增长率达130%，毛利率稳定在50%以上，此次GLM-4.7的技术突破，将进一步验证其“研发投入→技术迭代→商业变现”的闭环能力，为上市后的估值提供有力支撑。

业内人士分析，智谱在IPO前发布GLM-4.7，既是向资本市场证明其技术领先性，也是应对全球大模型竞争的重要布局。随着GLM-4.7的开源与落地，中国大模型企业在编程领域的全球竞争力将进一步提升，而智谱也有望凭借这一“技术王牌”，在即将到来的上市敲钟后开启新增长曲线。

# AI 资讯