Name: Kimi K2
Brand: 月之暗面

概述

Kimi K2 是月之暗面（Moonshot AI）于 2025 年 10 月发布的旗舰模型。Kimi 以超长文本处理能力起家——网页版长期以"200 万字上下文"为卖点出圈，K2 继续强化这一优势，在中文长文档分析场景中表现突出。

核心能力

超长文本处理

Kimi 的传统强项。可以处理：

200 万字中文长文（约 300 页）
整本学术著作
完整的法律卷宗
多份财报对比分析

在长文本理解的准确性和连贯性上，K2 在国产模型中名列前茅。月之暗面在长文场景的工程优化（chunking strategy、attention pattern）做得很扎实，比单纯堆上下文窗口的厂商质量更稳。

联网搜索

Kimi 网页版默认带联网搜索——回答问题时会先搜索最新信息，然后基于搜索结果生成回答。这解决了大模型知识截止的问题，相当于内置 RAG：

流程	说明
1. 用户提问	"今天上海股市怎么样"
2. Kimi 触发搜索	调用搜索引擎获取最新新闻
3. 抽取关键段落	选 Top-K 段落作为上下文
4. 生成回答	基于搜索结果回答 + 标注来源

API 端通过 tools 字段开启 $web_search 工具调用即可。

中文理解

CMMLU 89.4%，中文场景下的理解力和表达力优秀。特别适合：

中文合同条款分析
中文学术论文阅读
中文法律文书理解
古文 / 文学作品分析

API 调用示例

Kimi 提供 OpenAI 兼容 API：

from openai import OpenAI

client = OpenAI(
    api_key="sk-...",
    base_url="https://api.moonshot.cn/v1",
)

resp = client.chat.completions.create(
    model="moonshot-v1-128k",     # K2 旗舰
    temperature=0.3,
    messages=[
        {"role": "user", "content": LONG_CONTRACT + "\n\n找出风险点"}
    ],
)

文件直传（独有特性）

Kimi 提供文件上传接口，可以把整份 PDF / Word / 长文档直接上传，无需自己做 OCR / 解析：

file = client.files.create(
    file=open("contract.pdf", "rb"),
    purpose="file-extract",
)
content = client.files.content(file_id=file.id).text   # 返回提取后的文本

resp = client.chat.completions.create(
    model="moonshot-v1-128k",
    messages=[
        {"role": "system", "content": content},        # 文件内容作为 system
        {"role": "user", "content": "总结要点"},
    ],
)

这是国内模型里少数提供"上传文件直接对话"的，对法律 / 学术场景非常实用。

模型变种

模型	上下文	价格
`moonshot-v1-8k`	8K	¥12/M Input
`moonshot-v1-32k`	32K	¥24/M Input
`moonshot-v1-128k`	128K	¥60/M Input
`kimi-k2-0905-preview`	256K	¥4/M Input

新版 K2 系列降价显著，是性价比首选。moonshot-v1-128k 老模型贵但稳定。

定价

项目	价格
K2 Input	¥4 / 百万 token
K2 Output	¥12 / 百万 token
文件解析	按文件大小计费
网页版	免费（带速率限制）

API 价格高于 GLM-5.2（¥2/M）和 DeepSeek-V3（¥1/M），但网页版完全免费是一大杀手锏——团队成员可以直接在 kimi.com 上传文档对话，零成本。

网页版的隐形优势

Kimi 网页版的免费策略让它成为很多团队的"首选试水模型"：

产品经理直接拖文档分析需求
法务直接上传合同找风险
学生写论文做综述
程序员临时分析一份 log

很多企业最初接触 AI 就是从 Kimi 开始。但要进生产环境就要切到付费 API。

Kimi vs 其他国产模型

维度	Kimi K2	GLM-5.2	DeepSeek-V3	Qwen 3
长文本	★★★★★	★★★☆☆	★★★☆☆	★★★☆☆
编程	★★★☆☆	★★★★☆	★★★★☆	★★★☆☆
中文理解	★★★★★	★★★★★	★★★★☆	★★★★☆
联网搜索	✅ 内置	✅ 工具	❌	✅
文件直传	✅	❌	❌	❌
网页版免费	✅	✅	✅	✅
API 价格	¥4/¥12	¥2/¥6	¥1/¥2	¥0.8/¥2

建议：

长文档分析 / 文件直传 → Kimi K2
编程 → GLM-5.2 / DeepSeek-V3
低成本批量 → DeepSeek-V3 / Qwen 3
多语言 → Qwen 3

适合 / 不适合

✅ 适合：

法律文书 / 合同分析
学术论文阅读 / 综述
财报 / 招股书分析
多文档对比 / 综合
联网搜索 + 实时问答
文件直接上传场景

❌ 不适合：

AI 编程主力（HumanEval / SWE-bench 不行）
Agent 复杂工具调用
实时聊天（速度一般）
极致低成本场景（V3 / Qwen 更便宜）

避坑清单

8K 输出限制：长文本输入虽然支持 128K-256K，但 output 仍 8K。长报告生成要分段。
moonshot-v1-128k 价格高：60/180 价格远超新版 K2（4/12）。务必用新版 kimi-k2-*-preview。
联网搜索单独计费：每次调用 $web_search 工具计费，批量任务要关注账单。
文件解析有大小上限：单文件 100MB，超长卷宗需要分块上传。
没有 batch API：大批量离线场景不如 DeepSeek-V3。

Kimi K2

规格

基准测试

✓ 优势

⚠ 不足

适用场景

概述