
OpenRouter
AI API 聚合先驱——一个 Key + 一个 endpoint 调 300+ 模型,自动 fallback,OpenAI 兼容
AI API 聚合的全球事实标准——300+ 模型 / 一个 Key / 自动 fallback。海外开发者首选;国内开发者延迟 1500–3000ms + 不支持支付宝是硬伤,主走 OfoxAI / one-api 自建中转。
TL;DR
OpenRouter 是 AI API 聚合先驱——一个 OpenAI 兼容 endpoint + 一个 Key,调 60+ 厂商 300+ 模型,5M+ 用户。模型 passthrough 定价 0 markup,但充值有 5.5% 信用卡平台费($0.80 最低)+ BYOK 月 100 万请求后 5%。自动 fallback / playground / 海量模型选型是杀手锏。国内直连延迟 1500–3000ms + 不支持支付宝是硬伤。
适合:海外开发者;多模型选型 / 横评;生产 fallback 高可用;零迁移成本(OpenAI SDK 改 baseURL)。不适合:国内对延迟敏感的 AI 编程工具(用 OfoxAI / 自建中转);要支付宝 / 微信 / 银联;要 self-host(用 one-api / LiteLLM)。
核心能力
- 60+ 厂商 300+ 模型:OpenAI / Anthropic / Google / Meta / DeepSeek / MiniMax / Mistral / Cohere / xAI / NVIDIA / Qwen / 字节豆包 等
- OpenAI 兼容 endpoint:
https://openrouter.ai/api/v1,SDK 改 baseURL 即用 - 模型 ID 格式:
provider/model-name(如anthropic/claude-sonnet-4.6) - 自动 fallback:请求里列
models: [...],前者失败自动切后者 - Playground:5 模型并排测同 prompt + 成本 + 延迟 + 输出
- BYOK:自带 OpenAI / Anthropic Key,OpenRouter 只做网关;前 100 万 req/月免费,超 5% fee
- Passthrough 定价:模型按厂商官方价
- 免费模型:Llama 4 Scout / DeepSeek V4 Flash / Qwen3 Coder / Gemma 3 等,每日 5/200 次
- Provider ranking / SLA:dashboard 看每家 provider 延迟 + 错误率
- Rankings 页:模型按 token 消耗排名(市场热度参考)
价格
- Free:$1 credit + 免费模型 5/日 + 标准限流
- Pay-as-you-go:模型 passthrough + 5.5% 卡费(最低 $0.80)+ 充值 $5 后免费模型涨到 200/日
- Team:$99/月 + Priority routing + 99.9% SLA
- Enterprise:Custom 专属基础设施
- BYOK:前 100 万 req/月免费,超出 5%
实际总成本 ≈ 模型价 × (1 + 5.5%) + BYOK 5% × 月 >1M 部分。预算按 5–7% overhead 算。
实测(小型 SaaS 后端 / 海外节点)
亮点:
- 5 分钟接入,OpenAI SDK 改两行配置
- Playground 横评新模型省一大堆 boilerplate
- 自动 fallback 救命:Anthropic 4 小时宕机时应用零中断
- 模型 ID 提示器 + Rankings 看市场热度方便选型
- 海外节点延迟 300–600ms,CDN 体感好
踩坑(国内):
- 国内直连 1500–3000ms + 高峰超时率明显,Cursor / Claude Code 高频调用体感糟
- 不支持支付宝 / 微信 / 银联,只 Visa/Mastercard / USDC
- 信用卡费 5.5% 最低 $0.80,<$15 充值实际打到 10%+
- 模型 ID 点号分隔(
claude-sonnet-4.6)易跟连字符混 - Claude Code 默认走 Anthropic 原生协议,OpenRouter 适配偶有不一致
- 「免费模型」rate limit 后可能静默切付费
上手
- openrouter.ai → Google / GitHub OAuth 注册
- Keys → 创建 API Key(sk-or-xxx)
- 充值 $10+(Visa / Mastercard / USDC)→ 解锁更高免费配额
- 代码:
OpenAI(baseURL='https://openrouter.ai/api/v1', api_key=KEY) - 模型用
provider/model-name格式 - 加 fallback:
extra_body={"models": ["anthropic/claude-sonnet-4.6", "openai/gpt-5.4"]} - Playground 横评再批量切
对比
| 维度 | OpenRouter | LiteLLM | One-API | Portkey |
|---|---|---|---|---|
| 形态 | SaaS | OSS + SaaS | OSS | SaaS |
| 模型数 | 300+ | 100+ | 30+ | 250+ |
| 自托管 | ❌ | ✅ | ✅ | Enterprise |
| 中文支付 | ❌ | – | ✅ | – |
| Fallback | ✅ | ✅ | ✅ | ✅ |
| 国内延迟 | 1500–3000ms | 自托管自定 | 自托管自定 | 海外为主 |
| 成本 | 模型 + 5.5%/BYOK 5% | 自付服务器 | 自付服务器 | 按 logs 计费 |
避坑
- 国内别裸用:1500ms+ 起、超时率高,主链路上 OfoxAI / 自建 one-api 中转,OpenRouter 当冷门模型补
- 预算多算 5–7%:5.5% 信用卡 + BYOK 5% + 偶发汇率
- 免费模型生产慎用:rate limit 后可能静默 fallback 付费,账单失控
- 模型 ID 格式坑:点号 vs 连字符要测;新模型 ID 改名要监控
- fallback 别堆太多:5+ fallback 一次失败延迟叠加可能 10s+,前 2 个即可
- Claude Code 原生模式建议直连:OpenRouter 走 OpenAI 兼容协议有时与原生 Anthropic 协议有出入
适合 / 不适合
- ✅ 海外开发者 / 跨境业务
- ✅ 多模型选型 / 横评
- ✅ 生产 fallback 高可用
- ✅ 零迁移成本(OpenAI SDK 改 baseURL)
- ✅ BYOK 模式给团队统一 Key 管理
- ❌ 国内 AI 编程工具(Cursor / Claude Code)高频调用
- ❌ 要支付宝 / 微信 / 银联
- ❌ Self-host / 完全控制数据
- ❌ 极致低延迟实时应用
相关阅读
来源
- OfoxAI — OpenRouter 完全指南 2026(国内延迟实测 + 替代方案)https://ofox.ai/zh/blog/openrouter-complete-guide-china-developers-2026
- OfoxAI — OpenRouter Pricing 2026 Hidden Markup Breakdown https://ofox.ai/blog/openrouter-pricing-hidden-markup-breakdown-2026/
- DigitalApplied — OpenRouter June 2026 New Models & Pricing Roundup https://www.digitalapplied.com/blog/openrouter-new-models-june-2026-roundup-pricing-rankings
- AIToolBox — OpenRouter Review 2026 https://www.aitoolbox.hk/tools/open-router/
| 计划 | 价格 | 限制 | 国内支付 | 备注 |
|---|---|---|---|---|
| Free | $0 | — | — | |
| Pay-as-you-go | Passthrough + 5.5% 卡费 | — | — | |
| Team | $99/月 | — | — | |
| Enterprise | Custom | — | — |
国内能用吗?
技术上能(OpenAI SDK 改 baseURL),但服务器在海外、无国内节点:实测首 Token 延迟代理 600–1200ms / 直连 1500–3000ms 且不稳,高峰超时率高。AI 编程类高频调用(Cursor / Claude Code / Cline)国内体验糟糕,主流方案是用 OfoxAI / 自建 one-api/new-api 中转。
真的零 markup 吗?
模型本身按厂商官方价 passthrough,技术上 0 markup。但充值有两层平台费:信用卡 5.5%(最低 $0.80,小额充值实际打到 10–20%)、BYOK 月 100 万请求后 5%。预算时按上层多算 5–7%。
自动 fallback 怎么用?
请求里加 `models: ['anthropic/claude-sonnet-4.6', 'openai/gpt-5.4']`,前者失败 / 超时 / 限流时自动切到后者。生产 24h+ 不间断 AI 服务几乎刚需——Anthropic 2026 年 5 月 4 小时宕机,用 fallback 的应用零中断。
免费模型怎么用?
模型列表筛选 $0 价(如 Llama 4 Scout / DeepSeek V4 Flash / Qwen3 Coder / Gemma 3)。未充值每日 5 次,充 $5+ 涨到 200 次/日,附带 20 req/min。生产别依赖免费模型,限流 / 排队 / 暗切付费会让计费失控。