跳到主内容
AIHO 2026 全新改版上线
coding阿里巴巴

Qwen3-Coder

阿里 2025 年 7 月开源的 agentic 编码旗舰,480B/35B MoE,Apache 2.0,256K 上下文(可扩 1M),SWE-bench 开源 SOTA,配套 Qwen Code CLI。

规格

厂商
阿里巴巴
发布日期
2025/7/22
类型
coding
上下文窗口
256K tokens
最大输出
66K tokens
定价
开源可自部署 · 阿里云百炼 API 按量计费
API 兼容
openai, anthropic

基准测试

开源 SOTA(对标 Sonnet 4)
SWE-bench Verified
7.5T(70% 代码)
预训练 token

✓ 优势

  • 开源 agentic 编码旗舰,480B/35B MoE,Apache 2.0 可商用
  • 原生 256K 上下文,YaRN 外推可达 1M
  • SWE-bench Verified 开源 SOTA,对标 Claude Sonnet 4
  • 配套开源 CLI 工具 Qwen Code,原生支持工具调用
  • 7.5T token 预训练(70% 代码),repo 级数据优化

⚠ 不足

  • 480B 自部署门槛高,需多卡
  • Qwen Code 为研究用途,成熟度不及商业 CLI
  • 国内 API 走阿里云百炼,海外走 dashscope-intl
  • 纯通用对话不是强项,专精编码/agent

适用场景

开源 agentic 编码与 repo 级重构Browser-Use / Tool-Use agent需可商用开源权重的私有部署多轮 planning→工具→反馈循环

概述

Qwen3-Coder 是阿里巴巴(通义千问)于 2025 年 7 月 22 日开源的 agentic 编码模型,旗舰版 Qwen3-Coder-480B-A35B-Instruct 是 MoE 架构,发布时在开源模型中 agentic coding、browser-use、tool-use 全面 SOTA,性能对标 Claude Sonnet 4。Apache 2.0 许可,可商用。

核心能力

模型规格

项目参数
架构Mixture-of-Experts (MoE)
总参 / 激活480B / 35B
上下文256K 原生,YaRN 外推可达 1M
预训练7.5T token(70% 代码占比)
许可Apache 2.0

训练亮点

  • Code RL:聚焦「难解但易验证」的任务,通过扩展测试用例提升执行成功率
  • Long-Horizon RL(Agent RL):为多轮交互(planning→工具→反馈→决策)设计,借助阿里云并行运行 2 万个独立环境做强化学习,在 SWE-bench Verified 上无需 test-time scaling 即达 SOTA

Agentic 编码

专为 repo 级数据和动态输入(如 Pull Request)优化,是开源阵营里少有的「真能跑长链路 agent」的编码模型。关于 agent 概念见 AI Agent

使用方式

Qwen Code CLI

npm i -g @qwen-code/qwen-code

export OPENAI_API_KEY="your_api_key_here"
export OPENAI_BASE_URL="https://dashscope-intl.aliyuncs.com/compatible-mode/v1"
export OPENAI_MODEL="qwen3-coder-plus"

Qwen Code 是 fork 自 Gemini CLI 的研究用途 CLI,针对 Qwen-Coder 的函数调用和提示做了优化。

Claude Code / Cline 集成

可通过阿里云百炼的 Anthropic / OpenAI 兼容端点接入 Claude CodeCline

from openai import OpenAI
client = OpenAI(
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)
completion = client.chat.completions.create(
    model="qwen3-coder-plus",
    messages=[{"role": "user", "content": "帮我写一个在线书店网页"}],
)
print(completion.choices[0].message.content)

与同类模型怎么选

维度Qwen3-CoderMiniMax M2Kimi K2 Thinking
定位agentic 编码旗舰agent/编程性价比agent 推理 SOTA
参数480B/35B230B/10B1T/32B
上下文256K(可扩 1M)256K
许可Apache 2.0MITModified MIT
配套 CLIQwen Code

建议:要开源编码旗舰 + 配套 CLI(Qwen Code)选 Qwen3-Coder;成本敏感看 MiniMax M2;要最强推理看 Kimi K2 Thinking

避坑清单

  • 480B 自部署门槛高:个人优先用阿里云百炼 API 或 OpenRouter,别硬上本地。
  • Qwen Code 是研究用途:fork 自 Gemini CLI,成熟度不及商业 CLI,生产慎用。
  • 国内外端点不同:国内走 dashscope.aliyuncs.com,海外走 dashscope-intl。
  • 256K 不是默认 1M:1M 需 YaRN 外推,注意配置。

延伸阅读