
Hermes Agent
Nous Research 开源自进化 AI Agent,10 万 Star,MoA 混合智能体
2026 最火开源 Agent。MoA 混合智能体+自我进化+记忆系统+跨平台部署,GitHub 10 万 Star。适合长期陪伴型任务和自托管 Agent 研究,但中文支持和文档偏弱。
一句话结论
如果你想要一个完全开源、能自我进化、有长期记忆、可以部署在十几个消息平台上的 AI Agent——Hermes Agent 在 2026 年是最成熟的选择。GitHub 10 万 Star,2 月开源到 5 月就翻了一倍。
但它的门槛比 Manus 高一个量级:没有漂亮的 Web 界面,需要自己装 Python 环境、配置 LLM API、管理记忆数据库。它面向的是"想拥有自己 Agent 基础设施"的极客,不是"想要一个好用 AI 助手"的普通用户。
定位区分:Manus 是"帮你干完事的云端 Agent",OpenClaw 是"常驻你电脑的 AI 操作系统",Hermes Agent 是"你能完全掌控和改造的自进化 Agent"。三者目标不同,选型看你需要的是"用"还是"拥有"。
Hermes Agent 解决的核心问题
问题 1:Agent 没有"长期记忆"
大多数 AI Agent 的记忆只有当前会话的上下文窗口。你昨天让它做的事、偏好、上下文,今天全忘了。Hermes Agent 内置了分层记忆系统:
- 工作记忆:当前会话上下文,类似人类短期记忆
- 情景记忆:记录每次交互的时间、事件、结果,支持按时间线回溯
- 语义记忆:从交互中抽取知识(你告诉它的偏好、事实、规则),长期保存
- 技能记忆:Agent 自动总结"怎么做某件事"的步骤,下次直接调用
这意味着 Hermes Agent 是越用越好用的——它会记住你的工作习惯、项目上下文、你纠正过的错误。
问题 2:单个模型能力有天花板
2026 年 6 月,Nous Research 给 Hermes Agent 加了 MoA(Mixture of Agents) 功能:
- 多个 Agent 实例并行处理同一个任务
- 每个 Agent 可以用不同模型(Claude / GPT / Hermes / 本地模型)
- 结果由一个"聚合 Agent"合并去重、交叉验证
- 最终输出质量 > 任何单个模型
实际效果:用 3 个中档模型做 MoA,输出质量可以接近 1 个顶级模型,但成本只有 1/3。
问题 3:Agent 只能在一个地方用
Hermes Agent 支持 14 个消息渠道:
| 平台 | 状态 |
|---|---|
| Telegram | ✅ 推荐,最稳定 |
| Discord | ✅ |
| Slack | ✅ |
| ✅ | |
| Signal | ✅ |
| ✅ | |
| CLI(终端) | ✅ |
| Web UI | ✅ 基础版 |
| 微信 | ⚠️ 非官方,不稳定 |
你可以在 Telegram 上给它发消息让它做事,结果推送到 Discord;或者在 CLI 里开发时让它监听 Git 提交自动跑测试。一个 Agent 实例,多个入口。
核心能力
自我进化
Hermes Agent 最独特的能力是 Profile 系统:
- 每个 Profile 是一个"人格 + 技能包"的组合
- 你可以创建多个 Profile(如"代码助手"、"研究助手"、"项目经理")
- Agent 在执行任务后会自动总结经验,更新 Profile 的技能库
- 下次遇到类似任务,直接调用已有技能,不用从零开始
这意味着 Hermes Agent 不是"每次都从零开始的 ChatBot",而是"会积累经验的数字员工"。
工具调用
Hermes Agent 支持自定义工具(function calling):
- 搜索引擎(Google / Bing / SearXNG)
- 代码执行(Python sandbox)
- 文件读写
- Web 浏览(Playwright)
- 自定义 API 调用
- 数据库查询
工具配置是 JSON 格式,添加新工具只需写一个 function 定义。
记忆管理
记忆系统基于向量数据库(默认 ChromaDB):
- 自动从对话中提取关键信息存入语义记忆
- 支持手动"forget"删除特定记忆
- 记忆有 TTL(过期时间),避免无限膨胀
- 支持记忆导出/导入(JSON 格式),方便迁移
使用体验
安装部署
git clone https://github.com/NousResearch/hermes-agent
cd hermes-agent
pip install -r requirements.txt
cp .env.example .env
# 配置 LLM API key、消息平台 token
python -m hermes.agent
部署需要 Python 3.11+、至少 8GB RAM(跑本地模型需要更多)、向量数据库(默认 ChromaDB,可选 Qdrant)。
日常使用
最顺的使用方式是 Telegram + Claude API:
- 在 Telegram 上给 Agent 发消息
- Agent 读取记忆、规划任务、调用工具
- 执行过程中实时推送进度
- 完成后推送结果 + 自动更新记忆
体感类似"有一个 7×24 小时在线的助手",但它不是即问即答——复杂任务可能需要 2-5 分钟。
短板
- 文档偏英文:几乎没有中文文档,国内用户上手门槛高
- 稳定性:项目迭代极快(每周多个 commit),偶尔有 breaking change
- 资源消耗:记忆系统 + 多 Agent 会占用较多内存和 API token
- UI 简陋:Web UI 只是基础版,不如 Manus / OpenClaw 精致
价格
| 项目 | 成本 |
|---|---|
| Hermes Agent 本体 | 免费(开源) |
| LLM API | BYOK,用 Claude/GPT 按各自 API 计费 |
| 本地模型 | 免费但需要 GPU(70B 模型需 ~48GB VRAM) |
| 服务器 | 自托管需要一台 VPS(推荐 4 核 16GB 起步) |
| 消息平台 | Telegram/Discord 等均免费 |
最低成本:一台 $5/月 VPS + Claude API 按量付费 ≈ $10-20/月可跑日常任务。
与同类对比
| 维度 | Hermes Agent | Manus | OpenClaw |
|---|---|---|---|
| 开源 | ✅ | ❌ | ✅ |
| 自我进化 | ✅ Profile 系统 | ❌ | ⚠️ 有限 |
| 长期记忆 | ✅ 分层记忆 | ❌ 单会话 | ✅ |
| 跨平台部署 | ✅ 14 渠道 | ❌ Web only | ⚠️ 桌面+CLI |
| 上手难度 | ★★★★☆ | ★☆☆☆☆ | ★★★☆☆ |
| 中文体验 | ★★☆☆☆ | ★★★★☆ | ★★★☆☆ |
| 适合人群 | 极客/研究者 | 普通用户 | 开发者 |
FAQ
Q:Hermes Agent 能用中文交互吗? 能,但体验一般。Hermes 4 模型的中文能力不如 Claude/GPT,且文档和社区以英文为主。建议用 Claude/GPT 作为后端模型,中文交互质量会好很多。
Q:和 OpenManus 有什么区别? OpenManus 是 Manus 的开源复刻版,定位是"通用 Agent 执行器"。Hermes Agent 更侧重"长期陪伴+自我进化+多平台部署"。OpenManus 更轻量,Hermes 功能更全但更重。
Q:需要什么硬件? 纯 API 模式(用 Claude/GPT)只需一台普通 VPS。跑本地 Hermes 4 70B 需要 ~48GB VRAM,405B 需要 ~240GB VRAM(多卡服务器)。
Q:记忆数据存在哪? 默认存在本地 ChromaDB(SQLite + 向量索引)。可以配置为 Qdrant、Weaviate 等远程向量数据库。数据完全自主,不会上传到任何第三方。
Q:能同时跑多个 Profile 吗? 可以。每个 Profile 是独立的记忆+技能库,可以并行运行。比如同时让"代码助手"Profile 审查代码、"研究助手"Profile 做市场调研。
相关阅读
| 计划 | 价格 | 限制 | 国内支付 | 备注 |
|---|---|---|---|---|
| 开源版 | $0 | 完整功能,自托管 | — | BYOK 模式 |
| API(Hermes 4) | 按 token 计费 | 405B 模型按量付费 | ⚠️ 需海外卡 | 不想自托管时 |
- · 需要自托管、数据完全自主的 AI Agent
- · 对 Agent 自我进化 / 记忆系统有研究兴趣
- · 需要跨平台部署(Telegram / Discord / Slack 等多通道)
- · 有 GPU 服务器可以跑 Hermes 4 模型
- · 想要一个长期陪伴型个人 Agent
- · 需要中文为主交互的玩家(文档和界面均为英文)
- · 不想折腾部署和配置的个人用户
- · 需要生产级稳定性(项目仍在快速迭代)
- · 预算有限且没有 GPU 服务器的用户