国内企业知识库私有化首选。RAG 召回工程做得很细,可视化调试好用,docker-compose 一键部署。生态插件不如 Dify 丰富。
TL;DR
一句话: labring 团队开源的 LLM 知识库 RAG 平台,27k+ GitHub star(截至 2026-03 数据,腾讯云 2026-03 教程 引用),Apache 2.0 许可证可商用。核心优势是 RAG 链路工程做得极细——问题预处理、混合检索、重排序、上下文组装、答案生成每一步都可视化调参。
最大价值在 国内企业知识库 + 私有部署 场景。代价是 配置门槛:docker 基础 + 网络知识 + 一定运维能力。
来源说明:本文基于 fastgpt.io 官方页面、github.com/labring/FastGPT 仓库、南环 AI 2026-05 评测、腾讯云开发者社区 2026-03 部署教程综合整理。版本迭代较快,命令和价格请以最新官方文档为准。
核心特性
知识库管理(核心能力)
支持文件类型:
- 文档:PDF / Word / Markdown / TXT / HTML
- 表格:Excel / CSV
- 网页:URL 抓取 + 定时同步
- API:通过接口推送内容
处理流程:上传 → 文本切分 → 向量化 → 存储 → 可用于问答。支持:
- 文件夹分组:不同主题 / 部门分类
- 多种分块策略:默认按段落 / 按 token 数 / 自定义
- 批量导入:脚本化大批量同步
- 定时同步:网页源自动更新
RAG 流程编排(最强卖点)
南环 AI 2026 评测 总结的 FastGPT RAG 链路:
- 问题预处理:改写 / 扩展 / 错词纠正(提升召回率)
- 检索策略:语义检索 / 关键词 BM25 / 混合检索,可调相似度阈值
- 重排序(Rerank):对初步检索结果二次排序,提升相关性
- 上下文组装:最优 chunk + 问题 → prompt
- 答案生成:调大模型基于检索结果回答 + 引用标注
每一步都可视化调参,这是 FastGPT 比 Coze / Dify 在 纯知识库 QA 精度上更高的原因。
多模型支持(不绑定厂商)
| 模型类别 | 支持 |
|---|---|
| 国产闭源 | 豆包 / 通义千问 / 文心一言 / 智谱 GLM / Moonshot Kimi / MiniMax |
| 开源 | LLaMA / Qwen / ChatGLM / DeepSeek 等可自部署 |
| OpenAI 系 | GPT-5 / GPT-5 mini / o3 |
| Claude 系 | Sonnet 4 / Opus 4 / Haiku |
| 嵌入 / 重排 | BGE / m3e / OpenAI text-embedding-3 |
可以在 应用级别为不同知识库 / 不同场景配置不同模型,做"低成本 embedding + 高质量 LLM 生成"组合。
工作流与高级编排
新版本(v4.14.x)支持类似 Dify 的工作流节点编排——条件分支、循环、HTTP 调用、代码节点。能做"分类 → 路由到不同子知识库 → 不同模型回答"这类复杂场景。
多向量库选择
腾讯云教程 公开的 4 种向量后端:
| 后端 | 适用 |
|---|---|
| PgVector | 5000 万索引以下,新手 / 小规模 |
| Milvus | 亿级以上,高性能 |
| Zilliz Cloud | Milvus 全托管 SaaS |
| SeekDB / OceanBase | 企业级国产化 |
部署时选对应 docker-compose.{pgvector|milvus|...}.yml。
API 与 MCP
- 对话 API:流式 / 非流式 HTTP,OpenAI 兼容
- 知识库检索 API:单独调检索(不走生成)做 hybrid pipeline
- MCP Server:3005 端口暴露 MCP SSE 服务,可被 Claude Code 等客户端直接接入
- Webhook:回调通知
部署 10 分钟(Docker)
# 克隆代码
git clone https://github.com/labring/FastGPT.git
cd FastGPT
# 切到最新稳定版(参考 GitHub releases)
git switch -c 4.14.7.2
# 选向量库版本(个人 / 小规模选 pg)
cd deploy/docker/cn
wget https://doc.fastgpt.cn/deploy/config/config.json
# 启动
docker-compose -f docker-compose.pg.yml up -d
# 访问 http://<ip>:3000,默认账号 root / 1234
最低配置:2C4G + 20GB 硬盘 + Docker 28+ + Docker Compose 2.20+。
进入后台 → 账号 → 模型提供商 → 配置至少 1 个对话模型 + 1 个嵌入模型 → 即可开始建知识库。
云版 vs 自托管对比
fastgpt.io 官方定价 公开数据:
| 套餐 | 价格 | AI 积分 | 知识库索引 | 团队 | Agent | 知识库 | QPM |
|---|---|---|---|---|---|---|---|
| 免费 | ¥0 | 100 | 600 | 1 | 10 | 3 | 30 |
| 基础 | ¥99/月 | 4000 | 6000 | 5 | 50 | 30 | 300 |
| 高级 | ¥599/月 | 25000 | 36000 | 50 | 200 | 100 | 1500 |
| 定制 | 议价 | 弹性 | 弹性 | 弹性 | 弹性 | 弹性 | 弹性 |
云版适合:不想运维、量小、要快速上线 自托管适合:量大(10 万+ 日问答)、数据敏感、要深度定制——按 南环评测 估算:"日均 10 万次问答的企业场景,商业 SaaS 年费数十万,自建 FastGPT + 开源模型只需数万硬件投入"
与同类怎么选
| 维度 | FastGPT | Dify | Coze | RAGFlow | AnythingLLM |
|---|---|---|---|---|---|
| 核心定位 | 知识库 QA | 综合 LLMOps | Bot + 工作流 | 文档解析+RAG | 桌面级 KB |
| 开源 | ✅ Apache 2.0 | ✅ Apache 2.0 | ❌ | ✅ Apache 2.0 | ✅ MIT |
| 私有部署 | ★★★★★ docker | ★★★★★ | ⚠️ 仅企业版 | ★★★★☆ | ★★★★★ |
| RAG 深度 | ★★★★★ 最细 | ★★★★☆ | ★★★☆☆ | ★★★★★ 文档解析最强 | ★★★☆☆ |
| 工作流 | ★★★★☆ | ★★★★★ | ★★★★☆ | ★★★☆☆ | ★★☆☆☆ |
| 上手 | ★★★☆☆ 需 docker | ★★★★☆ | ★★★★★ 最简单 | ★★★☆☆ | ★★★★☆ |
| 中文优化 | ★★★★★ | ★★★★☆ | ★★★★★ | ★★★★☆ | ★★★☆☆ |
| 多平台发布 | ⚠️ API 为主 | ★★★★☆ | ★★★★★ | ⚠️ | ⚠️ |
怎么选(综合 南环 AI 评测):
- 核心需求是 RAG 精度 → FastGPT
- 需要丰富插件 + 复杂工作流 + 多平台发布 → Dify
- 零代码、快速发布到飞书 / 微信 → Coze
- 文档解析(含 OCR / 表格 / 公式)是瓶颈 → RAGFlow
- 桌面 / 单机使用 → AnythingLLM
很多企业同时用:FastGPT 做知识库底座 + Coze 做前端 Bot 发布 / 工作流编排。
避坑清单
- docker-compose 镜像 tag 不一致:腾讯云教程 实测的坑——某些版本编排文件的 image tag 与最新 release 不一致,启动报"镜像找不到",手动改
image:行为正确版本即可 - 3000 端口冲突:默认占用 3000(主服务)/ 9000(S3 / MinIO)/ 3005(MCP);改
docker-compose的 ports 映射端口 - PostgreSQL pgvector 不够用就换 Milvus:单库索引超 5000 万时 pgvector 查询性能下降,切 Milvus
- 向量库选错代价大:先评估索引量再选向量后端,迁移要重新 embedding 整库,按 南环评测:"新手 / 小规模 PgVector,中大规模 Milvus,企业 / 国产 OceanBase"
- MinIO 默认密码:
minioadmin/minioadmin,部署到公网前必须改 - 分段策略影响巨大:默认分段对长法律 / 医疗文档不友好,需调"按章节"或"自定义"
- 嵌入模型 ≠ 对话模型:经常有人只配 GPT-4 没配 embedding 模型,知识库无法索引——必须同时配两类
- 云版 AI 积分会过期:未用完不能跨月累积(按 fastgpt.io 定价 FAQ)
适合 / 不适合
✅ 适合:
- 企业内部知识库(员工手册 / 制度 / 流程)
- 产品 FAQ / 用户手册问答
- 医疗 / 法律 / 金融垂直领域知识系统
- 数据严格不出网 + Apache 2.0 商用
- 有 docker 运维基础的技术团队
- 需要把 RAG 当后端服务的开发者(API 接入业务系统)
❌ 不适合:
相关阅读
- 同类对比:Dify / Coze / RAGFlow / AnythingLLM / n8n
- 概念:RAG / Embedding / Vector Database / Reranker / AI Agent
- 模型:DeepSeek-V3 / Qwen3 / GLM-5.2 / Kimi K2 / 豆包 Doubao
- 进阶:Context Engineering / Prompt Engineering
来源
- 官网:https://fastgpt.io
- GitHub:https://github.com/labring/FastGPT
- 定价:https://fastgpt.io/zh/price
- 第三方评测:南环 AI / 腾讯云开发者社区 / 飞书 AGI 掘金知识库
本卡片由 AIHO 编辑部根据官方公开资料与第三方评测整理。所有事实点均标注来源;如发现价格 / 命令 / 功能与最新官方信息不一致,请通过 /submit 反馈。
| 计划 | 价格 | 限制 | 国内支付 | 备注 |
|---|---|---|---|---|
| Self-host 开源 | 免费 | 全功能 + 全数据本地 | — | Apache 2.0 可商用 |
| 云免费版 | ¥0/月 | 100 AI 积分 + 600 索引 + 3 知识库 | — | 试水 |
| 云基础版 | ¥99/月 | 4000 积分 + 6000 索引 + 50 Agent | ✅ 微信/支付宝 | 中小团队 SaaS |
| 云高级版 | ¥599/月 | 25000 积分 + 36000 索引 + 50 成员 + 200 Agent + 1500 QPM | ✅ | 企业级生产 |
| 云定制版 | 议价 | 弹性资源 + 深度技术支持 + 专属客户经理 | ✅ | 中大型企业 |
- · 企业内部知识库(员工手册、规章、流程)
- · 产品文档智能问答(FAQ / 用户手册)
- · 垂直领域知识库(医疗、法律、金融)
- · 数据严格不出网的合规场景
- · 需要精细 RAG 流程编排(重排序、混合检索、阈值调节)
- · 完全零代码 / 不懂 docker 的用户(去 Coze)
- · Bot 多平台一键发布场景(Coze 强项)
- · 插件 / 工作流复杂集成(去 Dify)
