技术上能（OpenAI SDK 改 baseURL），但服务器在海外、无国内节点：实测首 Token 延迟代理 600–1200ms / 直连 1500–3000ms 且不稳，高峰超时率高。AI 编程类高频调用（Cursor / Claude Code / Cline）国内体验糟糕，主流方案是用 OfoxAI / 自建 one-api/new-api 中转。

真的零 markup 吗？

模型本身按厂商官方价 passthrough，技术上 0 markup。但充值有两层平台费：信用卡 5.5%（最低 $0.80，小额充值实际打到 10–20%）、BYOK 月 100 万请求后 5%。预算时按上层多算 5–7%。

自动 fallback 怎么用？

请求里加 `models: ['anthropic/claude-sonnet-4.6', 'openai/gpt-5.4']`，前者失败 / 超时 / 限流时自动切到后者。生产 24h+ 不间断 AI 服务几乎刚需——Anthropic 2026 年 5 月 4 小时宕机，用 fallback 的应用零中断。

免费模型怎么用？

模型列表筛选 $0 价（如 Llama 4 Scout / DeepSeek V4 Flash / Qwen3 Coder / Gemma 3）。未充值每日 5 次，充 $5+ 涨到 200 次/日，附带 20 req/min。生产别依赖免费模型，限流 / 排队 / 暗切付费会让计费失控。

OpenRouter — AIHO

Name: OpenRouter
Rating: 3.8

TL;DR

OpenRouter 是 AI API 聚合先驱——一个 OpenAI 兼容 endpoint + 一个 Key，调 60+ 厂商 300+ 模型，5M+ 用户。模型 passthrough 定价 0 markup，但充值有 5.5% 信用卡平台费（$0.80 最低）+ BYOK 月 100 万请求后 5%。自动 fallback / playground / 海量模型选型是杀手锏。国内直连延迟 1500–3000ms + 不支持支付宝是硬伤。

适合：海外开发者；多模型选型 / 横评；生产 fallback 高可用；零迁移成本（OpenAI SDK 改 baseURL）。不适合：国内对延迟敏感的 AI 编程工具（用 OfoxAI / 自建中转）；要支付宝 / 微信 / 银联；要 self-host（用 one-api / LiteLLM）。

核心能力

60+ 厂商 300+ 模型：OpenAI / Anthropic / Google / Meta / DeepSeek / MiniMax / Mistral / Cohere / xAI / NVIDIA / Qwen / 字节豆包等
OpenAI 兼容 endpoint：https://openrouter.ai/api/v1，SDK 改 baseURL 即用
模型 ID 格式：provider/model-name（如 anthropic/claude-sonnet-4.6）
自动 fallback：请求里列 models: [...]，前者失败自动切后者
Playground：5 模型并排测同 prompt + 成本 + 延迟 + 输出
BYOK：自带 OpenAI / Anthropic Key，OpenRouter 只做网关；前 100 万 req/月免费，超 5% fee
Passthrough 定价：模型按厂商官方价
免费模型：Llama 4 Scout / DeepSeek V4 Flash / Qwen3 Coder / Gemma 3 等，每日 5/200 次
Provider ranking / SLA：dashboard 看每家 provider 延迟 + 错误率
Rankings 页：模型按 token 消耗排名（市场热度参考）

价格

Free：$1 credit + 免费模型 5/日 + 标准限流
Pay-as-you-go：模型 passthrough + 5.5% 卡费（最低 $0.80）+ 充值 $5 后免费模型涨到 200/日
Team：$99/月 + Priority routing + 99.9% SLA
Enterprise：Custom 专属基础设施
BYOK：前 100 万 req/月免费，超出 5%

实际总成本 ≈ 模型价 × (1 + 5.5%) + BYOK 5% × 月 >1M 部分。预算按 5–7% overhead 算。

实测（小型 SaaS 后端 / 海外节点）

亮点：

5 分钟接入，OpenAI SDK 改两行配置
Playground 横评新模型省一大堆 boilerplate
自动 fallback 救命：Anthropic 4 小时宕机时应用零中断
模型 ID 提示器 + Rankings 看市场热度方便选型
海外节点延迟 300–600ms，CDN 体感好

踩坑（国内）：

国内直连 1500–3000ms + 高峰超时率明显，Cursor / Claude Code 高频调用体感糟
不支持支付宝 / 微信 / 银联，只 Visa/Mastercard / USDC
信用卡费 5.5% 最低 $0.80，<$15 充值实际打到 10%+
模型 ID 点号分隔（claude-sonnet-4.6）易跟连字符混
Claude Code 默认走 Anthropic 原生协议，OpenRouter 适配偶有不一致
「免费模型」rate limit 后可能静默切付费

上手

openrouter.ai → Google / GitHub OAuth 注册
Keys → 创建 API Key（sk-or-xxx）
充值 $10+（Visa / Mastercard / USDC）→ 解锁更高免费配额
代码：OpenAI(baseURL='https://openrouter.ai/api/v1', api_key=KEY)
模型用 provider/model-name 格式
加 fallback：extra_body={"models": ["anthropic/claude-sonnet-4.6", "openai/gpt-5.4"]}
Playground 横评再批量切

对比

维度	OpenRouter	LiteLLM	One-API	Portkey
形态	SaaS	OSS + SaaS	OSS	SaaS
模型数	300+	100+	30+	250+
自托管	❌	✅	✅	Enterprise
中文支付	❌	–	✅	–
Fallback	✅	✅	✅	✅
国内延迟	1500–3000ms	自托管自定	自托管自定	海外为主
成本	模型 + 5.5%/BYOK 5%	自付服务器	自付服务器	按 logs 计费

避坑

国内别裸用：1500ms+ 起、超时率高，主链路上 OfoxAI / 自建 one-api 中转，OpenRouter 当冷门模型补
预算多算 5–7%：5.5% 信用卡 + BYOK 5% + 偶发汇率
免费模型生产慎用：rate limit 后可能静默 fallback 付费，账单失控
模型 ID 格式坑：点号 vs 连字符要测；新模型 ID 改名要监控
fallback 别堆太多：5+ fallback 一次失败延迟叠加可能 10s+，前 2 个即可
Claude Code 原生模式建议直连：OpenRouter 走 OpenAI 兼容协议有时与原生 Anthropic 协议有出入

适合 / 不适合

✅ 海外开发者 / 跨境业务
✅ 多模型选型 / 横评
✅ 生产 fallback 高可用
✅ 零迁移成本（OpenAI SDK 改 baseURL）
✅ BYOK 模式给团队统一 Key 管理
❌ 国内 AI 编程工具（Cursor / Claude Code）高频调用
❌ 要支付宝 / 微信 / 银联
❌ Self-host / 完全控制数据
❌ 极致低延迟实时应用

来源

OfoxAI — OpenRouter 完全指南 2026（国内延迟实测 + 替代方案）https://ofox.ai/zh/blog/openrouter-complete-guide-china-developers-2026
OfoxAI — OpenRouter Pricing 2026 Hidden Markup Breakdown https://ofox.ai/blog/openrouter-pricing-hidden-markup-breakdown-2026/
DigitalApplied — OpenRouter June 2026 New Models & Pricing Roundup https://www.digitalapplied.com/blog/openrouter-new-models-june-2026-roundup-pricing-rankings
AIToolBox — OpenRouter Review 2026 https://www.aitoolbox.hk/tools/open-router/

计划	价格	限制	国内支付
Free	$0	—	—
Pay-as-you-go	Passthrough + 5.5% 卡费	—	—
Team	$99/月	—	—
Enterprise	Custom	—	—