跳到主内容
AIHO 2026 全新改版上线
coding智谱 AI

GLM-5.2

智谱 AI GLM-5.2 旗舰大模型(2026 年发布),国产编程与 Agent 工具调用能力第一梯队,国内直连零延迟,输入 ¥2/M 价格友好,提供慷慨免费 API 额度与开源权重,国内开发者主力选项。

规格

厂商
智谱 AI
发布日期
2026/6/15
类型
coding
上下文窗口
128K tokens
最大输出
32K tokens
定价
Input ¥2/M · Output ¥6/M · 闭源免费 API 额度
API 兼容
openai

基准测试

65.3%
SWE-bench Verified
91.2%
HumanEval
85.6%
MMLU
92.3%
CMMLU

✓ 优势

  • 国产模型编程能力最强之一,中文代码注释理解优秀
  • 国内直连无需翻墙,API 响应快
  • 价格仅为 Claude/GPT 的 1/10
  • 免费 API 额度慷慨,个人开发者友好
  • 中文场景下指令理解优于海外模型

⚠ 不足

  • 128K 上下文小于 Claude Sonnet 4(200K)和 GPT-5(400K)
  • 复杂多步 Agent 场景下不如 Claude 稳定
  • 英文长文档推理能力略逊 GPT-5
  • 生态(MCP/工具链)不如 Anthropic/OpenAI 成熟

适用场景

国内开发者主力编程模型中文场景 AI 应用开发企业私有化部署(支持开源版本)Agent 平台(Coze / 元器 / Dify)后端模型

概述

GLM-5.2 是智谱 AI 于 2026 年 6 月发布的旗舰模型,定位为国产最强编程模型。SWE-bench Verified 65.3%,接近 Claude Sonnet 4 水平。最大优势是国内直连、价格极低、免费 API 额度慷慨。

核心能力

编程

SWE-bench Verified 65.3%,在国产模型中领先。在中文代码注释理解、中文技术文档生成方面优于海外模型。Cursor、Trae、CodeGeeX 等 IDE 已接入。

中文理解

CMMLU 92.3%,中文场景下的指令理解、上下文推理明显优于 GPT-5 和 Claude Sonnet 4。对于中文为主的开发团队,GLM-5.2 是更自然的选择。同样的 prompt 翻译成中文喂给 GLM,效果通常优于把英文 prompt 喂给 Claude。

国内直连

  • API 服务器在国内,延迟 < 100ms(vs Claude 中转 500ms+)
  • 无需翻墙、无需中转
  • 支持支付宝 / 微信付款
  • 企业可申请私有化部署
  • 备案合规,可上正式生产环境

Agent 能力

支持 function callingMCP 协议,可在 Coze、Dify、元器等 Agent 平台上使用。多步工具调用稳定性接近 Claude Sonnet 4 的 80%,已能胜任大部分企业 Agent 场景。

API 调用示例

GLM 提供 OpenAI 兼容接口,最低改动量从 OpenAI 迁过来:

from openai import OpenAI

client = OpenAI(
    api_key="...",
    base_url="https://open.bigmodel.cn/api/paas/v4/",
)

resp = client.chat.completions.create(
    model="glm-5.2",
    temperature=0,
    messages=[
        {"role": "system", "content": "你是资深 Python 工程师。"},
        {"role": "user", "content": "重构以下代码..."},
    ],
    tools=[...],   # function calling
)

原生 SDK(zhipuai)

from zhipuai import ZhipuAI
client = ZhipuAI(api_key="...")

resp = client.chat.completions.create(
    model="glm-5.2",
    messages=[{"role": "user", "content": "..."}],
    tools=[{
        "type": "web_search",      # GLM 内置工具:联网搜索
        "web_search": {"enable": True}
    }],
)

GLM 原生 SDK 额外提供了一些 OpenAI 兼容接口里没有的能力,比如 内置联网搜索工具code interpreterglyph 图片理解等。

关键参数

参数推荐说明
temperature0.1-0.3编程 / 工具调用
temperature0.7通用对话
top_p0.7(默认)不要同时调 temperature 和 top_p
max_tokens显式设默认值小,长输出务必调高
do_sampleTrueFalse 时退化为 greedy

注意 GLM 的 temperature 取值范围是 [0.0, 1.0](不是 OpenAI 的 0-2),且 0 不允许(要传 do_sample=False 才能 greedy)。

定价

项目价格
Input¥2 / 百万 token
Output¥6 / 百万 token
免费额度个人开发者每月 100 万 token(Free Tier)
企业批量优惠月消费 > 10 万元有阶梯折扣

对比 Claude Sonnet 4(Input $3 ≈ ¥21/M),GLM-5.2 的 Input 价格仅为其 1/10。对于预算有限的国内开发者,性价比极高。

在哪些工具中可以用到

  • Trae(字节 AI IDE)— 默认模型之一
  • CodeGeeX(智谱自家的 Copilot 插件)— 原生支持
  • CodeBuddy(腾讯 AI 编程助手)— 已接入
  • Coze / 元器(Agent 平台)— 后端模型选项
  • Dify — OpenAI 兼容接入
  • Cursor — 通过自定义 OpenAI 兼容 API 接入(settings → models)
  • Cline / Continue — 配置 baseURL 即可

模型家族

智谱 GLM 系列还有几个变种:

模型定位价格
GLM-5.2旗舰¥2/¥6
GLM-5.2-Air轻量快速¥0.5/¥1.5
GLM-5.2-Long1M 上下文¥2.5/¥7
GLM-5.2-Flash免费0
GLM-5.2-Vision多模态¥3/¥10

混搭使用:主力 GLM-5.2,简单任务降级到 Air,超长文档切换 Long,原型验证用免费的 Flash。

与海外模型怎么选

维度GLM-5.2Claude Sonnet 4GPT-5
编程能力★★★★☆★★★★★★★★★☆
中文理解★★★★★★★★★☆★★★★☆
国内访问✅ 直连❌ 需中转❌ 需中转
价格(Input)¥2/M¥21/M¥9/M
上下文128K200K400K
工具调用稳定性★★★★☆★★★★★★★★★★
生态成熟度★★★☆☆★★★★★★★★★★
合规备案

建议

  • 国内日常开发 / 备案合规生产 → GLM-5.2 性价比最高
  • 复杂 Agent / 大型项目 → Claude Sonnet 4
  • 多模态视频 → Gemini 2.5 Pro

与同档国产模型对比

维度GLM-5.2DeepSeek-V3Qwen 3Doubao 1.5 Pro
SWE-bench65.3%61.2%58.4%中等
价格 Input¥2/M¥1/M¥0.8/M¥0.8/M
上下文128K128K128K256K
编程定位中强中等一般
中文★★★★★★★★★★★★★★★★★
Agent★★★★★★★★★★★★★

避坑清单

  • temperature=0 不支持:要 greedy 解码必须 do_sample=False,否则直接报错。
  • base_url 末尾的斜杠:很多 SDK 对斜杠敏感,统一用 https://open.bigmodel.cn/api/paas/v4/(带尾斜杠)。
  • 免费额度有用量上限:单分钟 RPM 较低,生产场景一定要升级到付费档。
  • 联网搜索工具不便宜:每次触发 web_search 单独计费,批量使用要看清账单。
  • 工具调用格式:GLM-5.2 大体兼容 OpenAI tools 格式,但对 strict: true 模式支持不如 GPT-5,复杂 schema 建议用 Pydantic + 二次校验

延伸阅读