API 网关对比OpenRouterPortkeyLiteLLM

LLM API 网关实测：OpenRouter vs Portkey vs 自建 LiteLLM

AIHO 编辑部 · 2026-06-21

TL;DR

维度	OpenRouter	Portkey	LiteLLM (自建)
模式	托管聚合	Gateway + 托管	开源自托管
接入成本	极低（一个 key）	低（改 base URL）	中（部署 + 配置）
模型数	300+	1600+	取决于你接几家
Fallback	✅ 基础	✅ 高级	✅ 可配
成本透明	透传 + 5%	透传 + 按量	纯透传
数据隐私	过第三方	过第三方	完全自有
适合	个人 / 试水	生产团队	企业 / 合规

测试环境

应用：多模型 Agent，同时调 Claude / GPT / Gemini
调用量：日均 10K 次请求
时长：2 周，每种方案各跑 4-5 天
关注指标：延迟、成本、可靠性、运维负担

各方案实测

OpenRouter：最省心

import openai
client = openai.OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key="or-xxx"
)
# 一个 key 调 300+ 模型

体验：

✅ 接入 5 分钟，一个 key 通吃
✅ 自带模型路由和基础 fallback
✅ Dashboard 看消耗明细
⚠️ 多收 5% 路由费
⚠️ 偶尔有限流（高峰期 Claude 请求排队）
❌ 所有请求过 OpenRouter 服务器，数据隐私无保障

成本：日均 $50（模型费 $47.6 + OpenRouter 路由费 $2.4）

Portkey：生产级控制

const portkey = new Portkey({
  config: {
    strategy: { mode: "fallback" },
    targets: [
      { provider: "anthropic", override_params: { model: "claude-sonnet-4" } },
      { provider: "openai", override_params: { model: "gpt-5" } },
    ]
  }
})

体验：

✅ Fallback 逻辑强大——主模型挂了 0 延迟切备用
✅ 负载均衡——多个 API key 轮询，突破单 key 限流
✅ 语义缓存——相似请求命中缓存，省钱
⚠️ 配置比 OpenRouter 复杂
⚠️ 托管版数据也过第三方
❌ 无中国区节点

成本：日均 $48（模型费 $47.6 + Portkey $0.4 缓存省了点）

自建 LiteLLM：完全可控

# 部署
docker run -p 4000:4000 \
  -e ANTHROPIC_API_KEY=xxx \
  -e OPENAI_API_KEY=xxx \
  ghcr.io/berriai/litellm:main

client = openai.OpenAI(
    base_url="http://localhost:4000/v1",
    api_key="anything"
)

体验：

✅ 完全自托管，数据不出公司
✅ 纯透传，0 额外费用
✅ 统一 100+ 提供商到 OpenAI 格式
⚠️ 需要自己运维（监控、备份、升级）
⚠️ Fallback 配置是 YAML，不如 Portkey 灵活
❌ 没有托管 Dashboard（要自己接 Grafana）

成本：日均 $47.6（纯模型费）+ 服务器费 $2/天 ≈ $49.6

延迟对比

方案	P50 延迟	P95 延迟	说明
直连 OpenAI	320ms	850ms	基准
OpenRouter	380ms	1100ms	+60ms 路由开销
Portkey	350ms	900ms	+30ms，缓存命中更快
LiteLLM	340ms	880ms	+20ms，自建网络近

LiteLLM 延迟最低（自建内网），OpenRouter 最慢（多一跳）。

可靠性对比

2 周内记录的故障：

方案	故障次数	平均恢复	影响
OpenRouter	2 次（限流）	15 分钟	请求排队
Portkey	0 次	—	Fallback 生效
LiteLLM	1 次（OOM）	5 分钟	重启恢复

Portkey 最稳——fallback 机制让上游故障对用户不可见。

最终推荐

个人 / 试水 → OpenRouter（5 分钟接入）
生产团队 → Portkey（fallback + 缓存 + 可观测）
企业 / 合规 → 自建 LiteLLM（数据自有 + 0 路由费）

成本敏感 + 有运维 → LiteLLM（省 5% 路由费）
快速上线 → OpenRouter（最快）
高可用 → Portkey（fallback 最强）

踩坑记录

OpenRouter 限流不分模型——所有模型共享一个 rate limit，高峰期排队。
Portkey 缓存要配 TTL——默认永久缓存，prompt 微调就命中不了。
LiteLLM 内存——高并发时 OOM，调大容器内存或加 Redis 做队列。
三家都不支持流式 fallback——fallback 只在非流式请求生效，流式请求主模型挂了就直接报错。