coding阿里巴巴
Qwen3-Coder
阿里 2025 年 7 月开源的 agentic 编码旗舰,480B/35B MoE,Apache 2.0,256K 上下文(可扩 1M),SWE-bench 开源 SOTA,配套 Qwen Code CLI。
规格
- 厂商
- 阿里巴巴
- 发布日期
- 2025/7/22
- 类型
- coding
- 上下文窗口
- 256K tokens
- 最大输出
- 66K tokens
- 定价
- 开源可自部署 · 阿里云百炼 API 按量计费
- API 兼容
- openai, anthropic
基准测试
开源 SOTA(对标 Sonnet 4)
SWE-bench Verified
7.5T(70% 代码)
预训练 token
✓ 优势
- •开源 agentic 编码旗舰,480B/35B MoE,Apache 2.0 可商用
- •原生 256K 上下文,YaRN 外推可达 1M
- •SWE-bench Verified 开源 SOTA,对标 Claude Sonnet 4
- •配套开源 CLI 工具 Qwen Code,原生支持工具调用
- •7.5T token 预训练(70% 代码),repo 级数据优化
⚠ 不足
- •480B 自部署门槛高,需多卡
- •Qwen Code 为研究用途,成熟度不及商业 CLI
- •国内 API 走阿里云百炼,海外走 dashscope-intl
- •纯通用对话不是强项,专精编码/agent
适用场景
开源 agentic 编码与 repo 级重构Browser-Use / Tool-Use agent需可商用开源权重的私有部署多轮 planning→工具→反馈循环
概述
Qwen3-Coder 是阿里巴巴(通义千问)于 2025 年 7 月 22 日开源的 agentic 编码模型,旗舰版 Qwen3-Coder-480B-A35B-Instruct 是 MoE 架构,发布时在开源模型中 agentic coding、browser-use、tool-use 全面 SOTA,性能对标 Claude Sonnet 4。Apache 2.0 许可,可商用。
核心能力
模型规格
| 项目 | 参数 |
|---|---|
| 架构 | Mixture-of-Experts (MoE) |
| 总参 / 激活 | 480B / 35B |
| 上下文 | 256K 原生,YaRN 外推可达 1M |
| 预训练 | 7.5T token(70% 代码占比) |
| 许可 | Apache 2.0 |
训练亮点
- Code RL:聚焦「难解但易验证」的任务,通过扩展测试用例提升执行成功率
- Long-Horizon RL(Agent RL):为多轮交互(planning→工具→反馈→决策)设计,借助阿里云并行运行 2 万个独立环境做强化学习,在 SWE-bench Verified 上无需 test-time scaling 即达 SOTA
Agentic 编码
专为 repo 级数据和动态输入(如 Pull Request)优化,是开源阵营里少有的「真能跑长链路 agent」的编码模型。关于 agent 概念见 AI Agent。
使用方式
Qwen Code CLI
npm i -g @qwen-code/qwen-code
export OPENAI_API_KEY="your_api_key_here"
export OPENAI_BASE_URL="https://dashscope-intl.aliyuncs.com/compatible-mode/v1"
export OPENAI_MODEL="qwen3-coder-plus"
Qwen Code 是 fork 自 Gemini CLI 的研究用途 CLI,针对 Qwen-Coder 的函数调用和提示做了优化。
Claude Code / Cline 集成
可通过阿里云百炼的 Anthropic / OpenAI 兼容端点接入 Claude Code 或 Cline:
from openai import OpenAI
client = OpenAI(
api_key=os.getenv("DASHSCOPE_API_KEY"),
base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)
completion = client.chat.completions.create(
model="qwen3-coder-plus",
messages=[{"role": "user", "content": "帮我写一个在线书店网页"}],
)
print(completion.choices[0].message.content)
与同类模型怎么选
| 维度 | Qwen3-Coder | MiniMax M2 | Kimi K2 Thinking |
|---|---|---|---|
| 定位 | agentic 编码旗舰 | agent/编程性价比 | agent 推理 SOTA |
| 参数 | 480B/35B | 230B/10B | 1T/32B |
| 上下文 | 256K(可扩 1M) | 大 | 256K |
| 许可 | Apache 2.0 | MIT | Modified MIT |
| 配套 CLI | Qwen Code | — | — |
建议:要开源编码旗舰 + 配套 CLI(Qwen Code)选 Qwen3-Coder;成本敏感看 MiniMax M2;要最强推理看 Kimi K2 Thinking。
避坑清单
- 480B 自部署门槛高:个人优先用阿里云百炼 API 或 OpenRouter,别硬上本地。
- Qwen Code 是研究用途:fork 自 Gemini CLI,成熟度不及商业 CLI,生产慎用。
- 国内外端点不同:国内走 dashscope.aliyuncs.com,海外走 dashscope-intl。
- 256K 不是默认 1M:1M 需 YaRN 外推,注意配置。
延伸阅读
- 对比同类:MiniMax M2 / Kimi K2 Thinking / Claude Sonnet 4
- 配套工具:Qwen Code / Claude Code / Cline
- 概念:AI Agent / Function Calling