Kimi K2
月之暗面 Kimi K2 超长文本旗舰模型,单次可吞下数百万字上下文,中文长文档分析、合同 / 论文 / 财报理解能力国产最强之一,网页版完全免费可用,API 提供慷慨免费额度,长文场景首选。
规格
- 厂商
- 月之暗面
- 发布日期
- 2025/10/15
- 类型
- llm
- 上下文窗口
- 128K tokens
- 最大输出
- 8K tokens
- 定价
- Input ¥4/M · Output ¥12/M(免费 API 额度)
- API 兼容
- openai
基准测试
✓ 优势
- •超长文本处理能力国产最强之一
- •中文阅读理解优秀,适合文档分析
- •国内直连,响应快
- •Kimi 网页版免费使用,无门槛
- •支持联网搜索,回答有最新信息
⚠ 不足
- •编程能力不如 Claude/GLM-5.2
- •8K 输出窗口偏短
- •Agent/工具调用能力一般
- •API 价格高于 GLM-5.2
适用场景
概述
Kimi K2 是月之暗面(Moonshot AI)于 2025 年 10 月发布的旗舰模型。Kimi 以超长文本处理能力起家——网页版长期以"200 万字上下文"为卖点出圈,K2 继续强化这一优势,在中文长文档分析场景中表现突出。
核心能力
超长文本处理
Kimi 的传统强项。可以处理:
- 200 万字中文长文(约 300 页)
- 整本学术著作
- 完整的法律卷宗
- 多份财报对比分析
在长文本理解的准确性和连贯性上,K2 在国产模型中名列前茅。月之暗面在长文场景的工程优化(chunking strategy、attention pattern)做得很扎实,比单纯堆上下文窗口的厂商质量更稳。
联网搜索
Kimi 网页版默认带联网搜索——回答问题时会先搜索最新信息,然后基于搜索结果生成回答。这解决了大模型知识截止的问题,相当于内置 RAG:
| 流程 | 说明 |
|---|---|
| 1. 用户提问 | "今天上海股市怎么样" |
| 2. Kimi 触发搜索 | 调用搜索引擎获取最新新闻 |
| 3. 抽取关键段落 | 选 Top-K 段落作为上下文 |
| 4. 生成回答 | 基于搜索结果回答 + 标注来源 |
API 端通过 tools 字段开启 $web_search 工具调用即可。
中文理解
CMMLU 89.4%,中文场景下的理解力和表达力优秀。特别适合:
- 中文合同条款分析
- 中文学术论文阅读
- 中文法律文书理解
- 古文 / 文学作品分析
API 调用示例
Kimi 提供 OpenAI 兼容 API:
from openai import OpenAI
client = OpenAI(
api_key="sk-...",
base_url="https://api.moonshot.cn/v1",
)
resp = client.chat.completions.create(
model="moonshot-v1-128k", # K2 旗舰
temperature=0.3,
messages=[
{"role": "user", "content": LONG_CONTRACT + "\n\n找出风险点"}
],
)
文件直传(独有特性)
Kimi 提供文件上传接口,可以把整份 PDF / Word / 长文档直接上传,无需自己做 OCR / 解析:
file = client.files.create(
file=open("contract.pdf", "rb"),
purpose="file-extract",
)
content = client.files.content(file_id=file.id).text # 返回提取后的文本
resp = client.chat.completions.create(
model="moonshot-v1-128k",
messages=[
{"role": "system", "content": content}, # 文件内容作为 system
{"role": "user", "content": "总结要点"},
],
)
这是国内模型里少数提供"上传文件直接对话"的,对法律 / 学术场景非常实用。
模型变种
| 模型 | 上下文 | 价格 |
|---|---|---|
moonshot-v1-8k | 8K | ¥12/M Input |
moonshot-v1-32k | 32K | ¥24/M Input |
moonshot-v1-128k | 128K | ¥60/M Input |
kimi-k2-0905-preview | 256K | ¥4/M Input |
新版 K2 系列降价显著,是性价比首选。moonshot-v1-128k 老模型贵但稳定。
定价
| 项目 | 价格 |
|---|---|
| K2 Input | ¥4 / 百万 token |
| K2 Output | ¥12 / 百万 token |
| 文件解析 | 按文件大小计费 |
| 网页版 | 免费(带速率限制) |
API 价格高于 GLM-5.2(¥2/M)和 DeepSeek-V3(¥1/M),但网页版完全免费是一大杀手锏——团队成员可以直接在 kimi.com 上传文档对话,零成本。
网页版的隐形优势
Kimi 网页版的免费策略让它成为很多团队的"首选试水模型":
- 产品经理直接拖文档分析需求
- 法务直接上传合同找风险
- 学生写论文做综述
- 程序员临时分析一份 log
很多企业最初接触 AI 就是从 Kimi 开始。但要进生产环境就要切到付费 API。
Kimi vs 其他国产模型
| 维度 | Kimi K2 | GLM-5.2 | DeepSeek-V3 | Qwen 3 |
|---|---|---|---|---|
| 长文本 | ★★★★★ | ★★★☆☆ | ★★★☆☆ | ★★★☆☆ |
| 编程 | ★★★☆☆ | ★★★★☆ | ★★★★☆ | ★★★☆☆ |
| 中文理解 | ★★★★★ | ★★★★★ | ★★★★☆ | ★★★★☆ |
| 联网搜索 | ✅ 内置 | ✅ 工具 | ❌ | ✅ |
| 文件直传 | ✅ | ❌ | ❌ | ❌ |
| 网页版免费 | ✅ | ✅ | ✅ | ✅ |
| API 价格 | ¥4/¥12 | ¥2/¥6 | ¥1/¥2 | ¥0.8/¥2 |
建议:
- 长文档分析 / 文件直传 → Kimi K2
- 编程 → GLM-5.2 / DeepSeek-V3
- 低成本批量 → DeepSeek-V3 / Qwen 3
- 多语言 → Qwen 3
适合 / 不适合
✅ 适合:
- 法律文书 / 合同分析
- 学术论文阅读 / 综述
- 财报 / 招股书分析
- 多文档对比 / 综合
- 联网搜索 + 实时问答
- 文件直接上传场景
❌ 不适合:
- AI 编程主力(HumanEval / SWE-bench 不行)
- Agent 复杂工具调用
- 实时聊天(速度一般)
- 极致低成本场景(V3 / Qwen 更便宜)
避坑清单
- 8K 输出限制:长文本输入虽然支持 128K-256K,但 output 仍 8K。长报告生成要分段。
moonshot-v1-128k价格高:60/180 价格远超新版 K2(4/12)。务必用新版kimi-k2-*-preview。- 联网搜索单独计费:每次调用
$web_search工具计费,批量任务要关注账单。 - 文件解析有大小上限:单文件 100MB,超长卷宗需要分块上传。
- 没有 batch API:大批量离线场景不如 DeepSeek-V3。
延伸阅读
- 长文本相关:Context Engineering
- 同档国产:GLM-5.2 / DeepSeek-V3
- 联网搜索原理:RAG
- 检索增强:Embedding