GLM-5.2
智谱 AI GLM-5.2 旗舰大模型(2026 年发布),国产编程与 Agent 工具调用能力第一梯队,国内直连零延迟,输入 ¥2/M 价格友好,提供慷慨免费 API 额度与开源权重,国内开发者主力选项。
规格
- 厂商
- 智谱 AI
- 发布日期
- 2026/6/15
- 类型
- coding
- 上下文窗口
- 128K tokens
- 最大输出
- 32K tokens
- 定价
- Input ¥2/M · Output ¥6/M · 闭源免费 API 额度
- API 兼容
- openai
基准测试
✓ 优势
- •国产模型编程能力最强之一,中文代码注释理解优秀
- •国内直连无需翻墙,API 响应快
- •价格仅为 Claude/GPT 的 1/10
- •免费 API 额度慷慨,个人开发者友好
- •中文场景下指令理解优于海外模型
⚠ 不足
- •128K 上下文小于 Claude Sonnet 4(200K)和 GPT-5(400K)
- •复杂多步 Agent 场景下不如 Claude 稳定
- •英文长文档推理能力略逊 GPT-5
- •生态(MCP/工具链)不如 Anthropic/OpenAI 成熟
适用场景
概述
GLM-5.2 是智谱 AI 于 2026 年 6 月发布的旗舰模型,定位为国产最强编程模型。SWE-bench Verified 65.3%,接近 Claude Sonnet 4 水平。最大优势是国内直连、价格极低、免费 API 额度慷慨。
核心能力
编程
SWE-bench Verified 65.3%,在国产模型中领先。在中文代码注释理解、中文技术文档生成方面优于海外模型。Cursor、Trae、CodeGeeX 等 IDE 已接入。
中文理解
CMMLU 92.3%,中文场景下的指令理解、上下文推理明显优于 GPT-5 和 Claude Sonnet 4。对于中文为主的开发团队,GLM-5.2 是更自然的选择。同样的 prompt 翻译成中文喂给 GLM,效果通常优于把英文 prompt 喂给 Claude。
国内直连
- API 服务器在国内,延迟 < 100ms(vs Claude 中转 500ms+)
- 无需翻墙、无需中转
- 支持支付宝 / 微信付款
- 企业可申请私有化部署
- 备案合规,可上正式生产环境
Agent 能力
支持 function calling 和 MCP 协议,可在 Coze、Dify、元器等 Agent 平台上使用。多步工具调用稳定性接近 Claude Sonnet 4 的 80%,已能胜任大部分企业 Agent 场景。
API 调用示例
GLM 提供 OpenAI 兼容接口,最低改动量从 OpenAI 迁过来:
from openai import OpenAI
client = OpenAI(
api_key="...",
base_url="https://open.bigmodel.cn/api/paas/v4/",
)
resp = client.chat.completions.create(
model="glm-5.2",
temperature=0,
messages=[
{"role": "system", "content": "你是资深 Python 工程师。"},
{"role": "user", "content": "重构以下代码..."},
],
tools=[...], # function calling
)
原生 SDK(zhipuai)
from zhipuai import ZhipuAI
client = ZhipuAI(api_key="...")
resp = client.chat.completions.create(
model="glm-5.2",
messages=[{"role": "user", "content": "..."}],
tools=[{
"type": "web_search", # GLM 内置工具:联网搜索
"web_search": {"enable": True}
}],
)
GLM 原生 SDK 额外提供了一些 OpenAI 兼容接口里没有的能力,比如 内置联网搜索工具、code interpreter、glyph 图片理解等。
关键参数
| 参数 | 推荐 | 说明 |
|---|---|---|
temperature | 0.1-0.3 | 编程 / 工具调用 |
temperature | 0.7 | 通用对话 |
top_p | 0.7(默认) | 不要同时调 temperature 和 top_p |
max_tokens | 显式设 | 默认值小,长输出务必调高 |
do_sample | True | False 时退化为 greedy |
注意 GLM 的 temperature 取值范围是 [0.0, 1.0](不是 OpenAI 的 0-2),且 0 不允许(要传 do_sample=False 才能 greedy)。
定价
| 项目 | 价格 |
|---|---|
| Input | ¥2 / 百万 token |
| Output | ¥6 / 百万 token |
| 免费额度 | 个人开发者每月 100 万 token(Free Tier) |
| 企业批量优惠 | 月消费 > 10 万元有阶梯折扣 |
对比 Claude Sonnet 4(Input $3 ≈ ¥21/M),GLM-5.2 的 Input 价格仅为其 1/10。对于预算有限的国内开发者,性价比极高。
在哪些工具中可以用到
- Trae(字节 AI IDE)— 默认模型之一
- CodeGeeX(智谱自家的 Copilot 插件)— 原生支持
- CodeBuddy(腾讯 AI 编程助手)— 已接入
- Coze / 元器(Agent 平台)— 后端模型选项
- Dify — OpenAI 兼容接入
- Cursor — 通过自定义 OpenAI 兼容 API 接入(settings → models)
- Cline / Continue — 配置
baseURL即可
模型家族
智谱 GLM 系列还有几个变种:
| 模型 | 定位 | 价格 |
|---|---|---|
| GLM-5.2 | 旗舰 | ¥2/¥6 |
| GLM-5.2-Air | 轻量快速 | ¥0.5/¥1.5 |
| GLM-5.2-Long | 1M 上下文 | ¥2.5/¥7 |
| GLM-5.2-Flash | 免费 | 0 |
| GLM-5.2-Vision | 多模态 | ¥3/¥10 |
混搭使用:主力 GLM-5.2,简单任务降级到 Air,超长文档切换 Long,原型验证用免费的 Flash。
与海外模型怎么选
| 维度 | GLM-5.2 | Claude Sonnet 4 | GPT-5 |
|---|---|---|---|
| 编程能力 | ★★★★☆ | ★★★★★ | ★★★★☆ |
| 中文理解 | ★★★★★ | ★★★★☆ | ★★★★☆ |
| 国内访问 | ✅ 直连 | ❌ 需中转 | ❌ 需中转 |
| 价格(Input) | ¥2/M | ¥21/M | ¥9/M |
| 上下文 | 128K | 200K | 400K |
| 工具调用稳定性 | ★★★★☆ | ★★★★★ | ★★★★★ |
| 生态成熟度 | ★★★☆☆ | ★★★★★ | ★★★★★ |
| 合规备案 | ✅ | ❌ | ❌ |
建议:
- 国内日常开发 / 备案合规生产 → GLM-5.2 性价比最高
- 复杂 Agent / 大型项目 → Claude Sonnet 4
- 多模态视频 → Gemini 2.5 Pro
与同档国产模型对比
| 维度 | GLM-5.2 | DeepSeek-V3 | Qwen 3 | Doubao 1.5 Pro |
|---|---|---|---|---|
| SWE-bench | 65.3% | 61.2% | 58.4% | 中等 |
| 价格 Input | ¥2/M | ¥1/M | ¥0.8/M | ¥0.8/M |
| 上下文 | 128K | 128K | 128K | 256K |
| 编程定位 | 强 | 中强 | 中等 | 一般 |
| 中文 | ★★★★★ | ★★★★ | ★★★★ | ★★★★ |
| Agent | ★★★★ | ★★★ | ★★★ | ★★★ |
避坑清单
temperature=0不支持:要 greedy 解码必须do_sample=False,否则直接报错。- base_url 末尾的斜杠:很多 SDK 对斜杠敏感,统一用
https://open.bigmodel.cn/api/paas/v4/(带尾斜杠)。 - 免费额度有用量上限:单分钟 RPM 较低,生产场景一定要升级到付费档。
- 联网搜索工具不便宜:每次触发 web_search 单独计费,批量使用要看清账单。
- 工具调用格式:GLM-5.2 大体兼容 OpenAI tools 格式,但对
strict: true模式支持不如 GPT-5,复杂 schema 建议用 Pydantic + 二次校验。
延伸阅读
- 调用模式:Function Calling / MCP
- 同档对比:DeepSeek-V3 / Qwen 3
- 海外对标:Claude Sonnet 4