Name: GLM-5.2
Brand: 智谱 AI

概述

GLM-5.2 是智谱 AI 于 2026 年 6 月发布的旗舰模型，定位为国产最强编程模型。SWE-bench Verified 65.3%，接近 Claude Sonnet 4 水平。最大优势是国内直连、价格极低、免费 API 额度慷慨。

核心能力

编程

SWE-bench Verified 65.3%，在国产模型中领先。在中文代码注释理解、中文技术文档生成方面优于海外模型。Cursor、Trae、CodeGeeX 等 IDE 已接入。

中文理解

CMMLU 92.3%，中文场景下的指令理解、上下文推理明显优于 GPT-5 和 Claude Sonnet 4。对于中文为主的开发团队，GLM-5.2 是更自然的选择。同样的 prompt 翻译成中文喂给 GLM，效果通常优于把英文 prompt 喂给 Claude。

国内直连

API 服务器在国内，延迟 < 100ms（vs Claude 中转 500ms+）
无需翻墙、无需中转
支持支付宝 / 微信付款
企业可申请私有化部署
备案合规，可上正式生产环境

Agent 能力

支持 function calling 和 MCP 协议，可在 Coze、Dify、元器等 Agent 平台上使用。多步工具调用稳定性接近 Claude Sonnet 4 的 80%，已能胜任大部分企业 Agent 场景。

API 调用示例

GLM 提供 OpenAI 兼容接口，最低改动量从 OpenAI 迁过来：

from openai import OpenAI

client = OpenAI(
    api_key="...",
    base_url="https://open.bigmodel.cn/api/paas/v4/",
)

resp = client.chat.completions.create(
    model="glm-5.2",
    temperature=0,
    messages=[
        {"role": "system", "content": "你是资深 Python 工程师。"},
        {"role": "user", "content": "重构以下代码..."},
    ],
    tools=[...],   # function calling
)

原生 SDK（zhipuai）

from zhipuai import ZhipuAI
client = ZhipuAI(api_key="...")

resp = client.chat.completions.create(
    model="glm-5.2",
    messages=[{"role": "user", "content": "..."}],
    tools=[{
        "type": "web_search",      # GLM 内置工具：联网搜索
        "web_search": {"enable": True}
    }],
)

GLM 原生 SDK 额外提供了一些 OpenAI 兼容接口里没有的能力，比如 内置联网搜索工具、code interpreter、glyph 图片理解等。

关键参数

参数	推荐	说明
`temperature`	0.1-0.3	编程 / 工具调用
`temperature`	0.7	通用对话
`top_p`	0.7（默认）	不要同时调 temperature 和 top_p
`max_tokens`	显式设	默认值小，长输出务必调高
`do_sample`	True	False 时退化为 greedy

注意 GLM 的 temperature 取值范围是 [0.0, 1.0]（不是 OpenAI 的 0-2），且 0 不允许（要传 do_sample=False 才能 greedy）。

定价

项目	价格
Input	¥2 / 百万 token
Output	¥6 / 百万 token
免费额度	个人开发者每月 100 万 token（Free Tier）
企业批量优惠	月消费 > 10 万元有阶梯折扣

对比 Claude Sonnet 4（Input $3 ≈ ¥21/M），GLM-5.2 的 Input 价格仅为其 1/10。对于预算有限的国内开发者，性价比极高。

在哪些工具中可以用到

Trae（字节 AI IDE）— 默认模型之一
CodeGeeX（智谱自家的 Copilot 插件）— 原生支持
CodeBuddy（腾讯 AI 编程助手）— 已接入
Coze / 元器（Agent 平台）— 后端模型选项
Dify — OpenAI 兼容接入
Cursor — 通过自定义 OpenAI 兼容 API 接入（settings → models）
Cline / Continue — 配置 baseURL 即可

模型家族

智谱 GLM 系列还有几个变种：

模型	定位	价格
GLM-5.2	旗舰	¥2/¥6
GLM-5.2-Air	轻量快速	¥0.5/¥1.5
GLM-5.2-Long	1M 上下文	¥2.5/¥7
GLM-5.2-Flash	免费	0
GLM-5.2-Vision	多模态	¥3/¥10

混搭使用：主力 GLM-5.2，简单任务降级到 Air，超长文档切换 Long，原型验证用免费的 Flash。

与海外模型怎么选

维度	GLM-5.2	Claude Sonnet 4	GPT-5
编程能力	★★★★☆	★★★★★	★★★★☆
中文理解	★★★★★	★★★★☆	★★★★☆
国内访问	✅ 直连	❌ 需中转	❌ 需中转
价格（Input）	¥2/M	¥21/M	¥9/M
上下文	128K	200K	400K
工具调用稳定性	★★★★☆	★★★★★	★★★★★
生态成熟度	★★★☆☆	★★★★★	★★★★★
合规备案	✅	❌	❌

建议：

国内日常开发 / 备案合规生产 → GLM-5.2 性价比最高
复杂 Agent / 大型项目 → Claude Sonnet 4
多模态视频 → Gemini 2.5 Pro

与同档国产模型对比

维度	GLM-5.2	DeepSeek-V3	Qwen 3	Doubao 1.5 Pro
SWE-bench	65.3%	61.2%	58.4%	中等
价格 Input	¥2/M	¥1/M	¥0.8/M	¥0.8/M
上下文	128K	128K	128K	256K
编程定位	强	中强	中等	一般
中文	★★★★★	★★★★	★★★★	★★★★
Agent	★★★★	★★★	★★★	★★★

避坑清单

temperature=0 不支持：要 greedy 解码必须 do_sample=False，否则直接报错。
base_url 末尾的斜杠：很多 SDK 对斜杠敏感，统一用 https://open.bigmodel.cn/api/paas/v4/（带尾斜杠）。
免费额度有用量上限：单分钟 RPM 较低，生产场景一定要升级到付费档。
联网搜索工具不便宜：每次触发 web_search 单独计费，批量使用要看清账单。
工具调用格式：GLM-5.2 大体兼容 OpenAI tools 格式，但对 strict: true 模式支持不如 GPT-5，复杂 schema 建议用 Pydantic + 二次校验。

GLM-5.2

规格

基准测试

✓ 优势

⚠ 不足

适用场景

概述