跳到主内容
AIHO 2026 全新改版上线
llm月之暗面

Kimi K2

月之暗面 Kimi K2 超长文本旗舰模型,单次可吞下数百万字上下文,中文长文档分析、合同 / 论文 / 财报理解能力国产最强之一,网页版完全免费可用,API 提供慷慨免费额度,长文场景首选。

规格

厂商
月之暗面
发布日期
2025/10/15
类型
llm
上下文窗口
128K tokens
最大输出
8K tokens
定价
Input ¥4/M · Output ¥12/M(免费 API 额度)
API 兼容
openai

基准测试

82.6%
HumanEval
82.1%
MMLU
89.4%
CMMLU

✓ 优势

  • 超长文本处理能力国产最强之一
  • 中文阅读理解优秀,适合文档分析
  • 国内直连,响应快
  • Kimi 网页版免费使用,无门槛
  • 支持联网搜索,回答有最新信息

⚠ 不足

  • 编程能力不如 Claude/GLM-5.2
  • 8K 输出窗口偏短
  • Agent/工具调用能力一般
  • API 价格高于 GLM-5.2

适用场景

超长文档分析(合同/论文/财报)中文阅读理解与摘要联网搜索问答学术研究辅助

概述

Kimi K2 是月之暗面(Moonshot AI)于 2025 年 10 月发布的旗舰模型。Kimi 以超长文本处理能力起家——网页版长期以"200 万字上下文"为卖点出圈,K2 继续强化这一优势,在中文长文档分析场景中表现突出。

核心能力

超长文本处理

Kimi 的传统强项。可以处理:

  • 200 万字中文长文(约 300 页)
  • 整本学术著作
  • 完整的法律卷宗
  • 多份财报对比分析

在长文本理解的准确性和连贯性上,K2 在国产模型中名列前茅。月之暗面在长文场景的工程优化(chunking strategy、attention pattern)做得很扎实,比单纯堆上下文窗口的厂商质量更稳。

联网搜索

Kimi 网页版默认带联网搜索——回答问题时会先搜索最新信息,然后基于搜索结果生成回答。这解决了大模型知识截止的问题,相当于内置 RAG

流程说明
1. 用户提问"今天上海股市怎么样"
2. Kimi 触发搜索调用搜索引擎获取最新新闻
3. 抽取关键段落选 Top-K 段落作为上下文
4. 生成回答基于搜索结果回答 + 标注来源

API 端通过 tools 字段开启 $web_search 工具调用即可。

中文理解

CMMLU 89.4%,中文场景下的理解力和表达力优秀。特别适合:

  • 中文合同条款分析
  • 中文学术论文阅读
  • 中文法律文书理解
  • 古文 / 文学作品分析

API 调用示例

Kimi 提供 OpenAI 兼容 API:

from openai import OpenAI

client = OpenAI(
    api_key="sk-...",
    base_url="https://api.moonshot.cn/v1",
)

resp = client.chat.completions.create(
    model="moonshot-v1-128k",     # K2 旗舰
    temperature=0.3,
    messages=[
        {"role": "user", "content": LONG_CONTRACT + "\n\n找出风险点"}
    ],
)

文件直传(独有特性)

Kimi 提供文件上传接口,可以把整份 PDF / Word / 长文档直接上传,无需自己做 OCR / 解析:

file = client.files.create(
    file=open("contract.pdf", "rb"),
    purpose="file-extract",
)
content = client.files.content(file_id=file.id).text   # 返回提取后的文本

resp = client.chat.completions.create(
    model="moonshot-v1-128k",
    messages=[
        {"role": "system", "content": content},        # 文件内容作为 system
        {"role": "user", "content": "总结要点"},
    ],
)

这是国内模型里少数提供"上传文件直接对话"的,对法律 / 学术场景非常实用。

模型变种

模型上下文价格
moonshot-v1-8k8K¥12/M Input
moonshot-v1-32k32K¥24/M Input
moonshot-v1-128k128K¥60/M Input
kimi-k2-0905-preview256K¥4/M Input

新版 K2 系列降价显著,是性价比首选。moonshot-v1-128k 老模型贵但稳定。

定价

项目价格
K2 Input¥4 / 百万 token
K2 Output¥12 / 百万 token
文件解析按文件大小计费
网页版免费(带速率限制)

API 价格高于 GLM-5.2(¥2/M)和 DeepSeek-V3(¥1/M),但网页版完全免费是一大杀手锏——团队成员可以直接在 kimi.com 上传文档对话,零成本。

网页版的隐形优势

Kimi 网页版的免费策略让它成为很多团队的"首选试水模型":

  • 产品经理直接拖文档分析需求
  • 法务直接上传合同找风险
  • 学生写论文做综述
  • 程序员临时分析一份 log

很多企业最初接触 AI 就是从 Kimi 开始。但要进生产环境就要切到付费 API。

Kimi vs 其他国产模型

维度Kimi K2GLM-5.2DeepSeek-V3Qwen 3
长文本★★★★★★★★☆☆★★★☆☆★★★☆☆
编程★★★☆☆★★★★☆★★★★☆★★★☆☆
中文理解★★★★★★★★★★★★★★☆★★★★☆
联网搜索✅ 内置✅ 工具
文件直传
网页版免费
API 价格¥4/¥12¥2/¥6¥1/¥2¥0.8/¥2

建议

  • 长文档分析 / 文件直传 → Kimi K2
  • 编程 → GLM-5.2 / DeepSeek-V3
  • 低成本批量 → DeepSeek-V3 / Qwen 3
  • 多语言 → Qwen 3

适合 / 不适合

✅ 适合:

  • 法律文书 / 合同分析
  • 学术论文阅读 / 综述
  • 财报 / 招股书分析
  • 多文档对比 / 综合
  • 联网搜索 + 实时问答
  • 文件直接上传场景

❌ 不适合:

  • AI 编程主力(HumanEval / SWE-bench 不行)
  • Agent 复杂工具调用
  • 实时聊天(速度一般)
  • 极致低成本场景(V3 / Qwen 更便宜)

避坑清单

  • 8K 输出限制:长文本输入虽然支持 128K-256K,但 output 仍 8K。长报告生成要分段。
  • moonshot-v1-128k 价格高:60/180 价格远超新版 K2(4/12)。务必用新版 kimi-k2-*-preview
  • 联网搜索单独计费:每次调用 $web_search 工具计费,批量任务要关注账单。
  • 文件解析有大小上限:单文件 100MB,超长卷宗需要分块上传。
  • 没有 batch API:大批量离线场景不如 DeepSeek-V3。

延伸阅读

相关工具