Doubao 1.5 Pro
字节跳动豆包(Doubao)1.5 Pro 旗舰模型,256K 超长上下文 + 多模态原生支持,火山引擎稳定服务无境外延迟,输入 ¥0.8/M 极低价,深度集成飞书 / 抖音 / 扣子(Coze)生态,国内合规场景首选。
规格
- 厂商
- 字节跳动
- 发布日期
- 2025/6/20
- 类型
- llm
- 上下文窗口
- 256K tokens
- 最大输出
- 16K tokens
- 定价
- Input ¥0.8/M · Output ¥2/M(火山引擎)
- API 兼容
- openai
基准测试
✓ 优势
- •256K 上下文,国产模型中较长
- •价格极低,与 Qwen 3 / DeepSeek 持平
- •字节生态集成(飞书/抖音/剪映)
- •国内直连,火山引擎稳定
- •多模态支持(图片理解)
⚠ 不足
- •编程能力弱于 Claude/GLM
- •英文能力一般
- •开源程度低(仅 API)
- •社区生态不如 Llama/Qwen
适用场景
概述
Doubao 1.5 Pro 是字节跳动于 2025 年 6 月发布的旗舰模型。最大优势是字节生态集成——飞书、抖音、剪映等字节系产品原生支持豆包模型,企业用户在火山引擎上一键调用。
豆包的策略路线很清晰:不与 GLM / DeepSeek 抢编程市场,而是吃字节生态的"内场"——飞书办公场景、抖音内容场景、Coze 平台后端。
核心能力
256K 上下文
在国产模型中上下文窗口较长:
| 模型 | 上下文 |
|---|---|
| Doubao 1.5 Pro | 256K |
| GLM-5.2 | 128K |
| DeepSeek-V3 | 128K |
| Kimi K2 | 128K-256K |
| Qwen-Long | 10M |
适合处理:
- 中型项目全量代码
- 长篇法律文档
- 多份合同对比
- 完整学术论文
字节生态
豆包深度集成字节系产品:
| 产品 | 集成方式 |
|---|---|
| 飞书 | 智能助手、会议纪要、文档摘要、自动回复 |
| 抖音 | 内容审核、推荐算法辅助、评论分析 |
| 剪映 | 视频脚本生成、字幕翻译、智能剪辑 |
| Coze(扣子) | Agent 平台默认后端模型 |
| Trae | AI IDE 默认模型之一 |
| 巨量引擎 | 广告文案生成 |
如果企业已经在用飞书办公,接入豆包做智能助手是最自然的——SSO 打通、数据合规一站搞定。
火山引擎
通过火山引擎 API 调用,企业级 SLA 保障:
- 99.95% 可用性
- 低延迟(国内 < 50ms)
- 支持私有部署(大客户)
- 与字节其他云服务(数据库、对象存储)打通
- 合规备案齐全
多模态
支持图片输入,图片理解能力可处理:
- OCR 文档识别
- 商品图分析
- 表格图理解
- UI 截图分析
视频理解能力(豆包视频版)也在持续追赶 Gemini,目前在国产中视频 + 多模态做得最好的之一。
API 调用示例
豆包通过火山引擎方舟(Ark)平台调用,提供 OpenAI 兼容接口:
from openai import OpenAI
client = OpenAI(
api_key="...",
base_url="https://ark.cn-beijing.volces.com/api/v3",
)
resp = client.chat.completions.create(
model="ep-xxxxxxxxx", # 你的端点 ID(在火山控制台创建)
temperature=0.3,
messages=[
{"role": "user", "content": "..."},
],
)
注意:豆包的 model 参数不是模型名称,而是端点 ID(endpoint ID)——你需要先在火山控制台为某个模型创建一个端点,然后用端点 ID 调用。这种设计的好处是端点级别可以做版本灰度、QPS 控制、计费归属,企业场景更灵活。
模型家族
| 模型 | 定位 | Input | Output |
|---|---|---|---|
| doubao-1-5-pro-256k | 旗舰 | ¥0.8/M | ¥2/M |
| doubao-1-5-pro-32k | 标准 | ¥0.3/M | ¥0.6/M |
| doubao-1-5-lite-32k | 轻量 | ¥0.15/M | ¥0.45/M |
| doubao-vision-pro | 多模态 | ¥3/M | ¥9/M |
| doubao-embedding | 向量 | ¥0.5/M | — |
doubao-1-5-lite-32k 是国产里非常具竞争力的轻量选项——便宜过 GPT-4o-mini,质量接近 GLM Air。
定价
| 项目 | 价格 |
|---|---|
| Input | ¥0.8 / 百万 token |
| Output | ¥2 / 百万 token |
| 免费额度 | 个人开发者每月一定额度 |
与 Qwen 3 持平,是国产模型中第二便宜的旗舰模型。
适合什么场景
✅ 适合:
- 字节系企业:已用飞书/抖音/火山引擎,用豆包最自然
- 企业客服:火山引擎 SLA 稳定,价格低
- 中文内容生成:中文能力不错,价格低
- 多模态:图片理解能力可满足基本需求
- Coze 平台 Agent:作为默认后端模型集成最深
- 抖音电商应用:商品描述生成、评论分析、智能客服
- 私有化部署:火山引擎专属实例(大客户)
❌ 不适合什么场景:
- 编程主力:能力不如 Claude Sonnet 4 / GLM-5.2
- 英文场景:英文能力一般,跨境出海应用建议 Qwen
- 私有化研究 / 微调:不开源,无法在自有 GPU 上微调
- 社区生态:不如 Llama/Qwen 开源生态丰富
- 复杂 Agent 多步推理:稳定性不如 Claude
实战:与 Coze 配合
豆包 + Coze 是字节给非技术人员设计的"零代码 AI 应用"组合:
[Coze 工作流]
用户问题
↓
豆包模型分析意图
↓
调用工具节点(搜索/数据库/API)
↓
豆包生成最终回答
↓
发送到飞书/微信/网页
PM / 运营 / 客服主管不写代码就能搭出企业级 AI 应用,背后跑的就是豆包。
Doubao vs 同档国产对比
| 维度 | Doubao 1.5 Pro | GLM-5.2 | DeepSeek-V3 | Qwen 3 |
|---|---|---|---|---|
| HumanEval | 78.3% | 91.2% | 88.5% | 86.7% |
| CMMLU | 86.2% | 92.3% | 89.7% | 88.9% |
| 上下文 | 256K | 128K | 128K | 128K |
| 价格 Input | ¥0.8/M | ¥2/M | ¥1/M | ¥0.8/M |
| 开源 | ❌ | 部分 | ✅ | ✅ 全系列 |
| 生态集成 | 字节全家桶 | 智谱独立 | 独立 | 阿里云全套 |
| 多模态 | ✅ | ✅ | ❌ | ✅ |
| Agent 平台 | Coze(强) | 元器 | 独立 | 百炼 |
避坑清单
- 端点 ID 不是模型名:很多开发者第一次接入时把模型名(如
doubao-1-5-pro-256k)直接传给model参数,会报错。必须先在控制台创建端点,用端点 ID(ep-xxxxxxxxx)调用。 base_url注意区域:北京 / 上海等不同区域 URL 不同,企业需选最近 region。- 私有部署门槛高:要求年消费达标,不是小客户能用上的。
- 不要拿它写代码:HumanEval 78.3% 远低于 GLM-5.2 / DeepSeek-V3 / Qwen3,AI 编程场景换模型。
- 多模态价格翻几倍:
doubao-vision-pro是doubao-1-5-pro的 4 倍价格,按需切。