受够了 OpenClaw 的失忆,我本周爱上了 Hermes Agent

大多数人以为 Hermes 只是一个 AI 聊天框架。但它实际上是一个可长期运行多角色协作多入口接入的 Agent Runtime,已经非常接近真正意义上的 AI Operating System。

Hermes Agent 在不到三个月内突破 14 万 GitHub Star,并根据 OpenRouter 的数据成为目前全球使用量最大的 Agent。在折腾了 2 个月,受够了 OpenClaw 的失忆后,我尝试用业界火热的 Hermes Agent,效果居然出奇的好,因此写下这篇安利文章。

关键词:#openclaw #Hermes 能力标签:多Agent协作 · 长期记忆隔离 · 子代理并行 · 多用户隔离 · 任务编排 · Agent Runtime

为什么这么火?三个根本原因

1. 解决了 Agent 领域最痛的问题——失忆

Hermes 要解决的正是这个问题,不是用 prompt 技巧,而是在架构层面内置了一个闭环学习机制——运行时间越长,它就越了解你。

2. 自我进化的技能系统

Hermes 有四个核心差异化能力,其中最突出的是"自进化技能"——它会自己编写并优化 skill 文档。每当 Hermes 解决一个困难问题,它就会写下一份可复用的 skill 文档,之后永远不会忘记这个解法。这些 skill 可搜索、可共享,并兼容 agentskills.io 开放标准。

3. 真正开源、极低门槛、隐私友好

Hermes 由 Nous Research 开发,MIT 协议开源,支持 Linux / macOS / WSL2,一行 curl 命令自动完成所有安装,无需手动配置。所有数据留在本地,没有遥测,没有追踪,没有云锁定。

Hermes 火在时机对(大家都被"失忆 Agent"折磨够了)+ 架构真不同(持久记忆 + 自我进化)+ 开源免费好上手,三者叠加,引爆了社区。

理解 Hermes 的关键,在于它的多 Agent 能力并非简单的"多开几个窗口",而是由三个相互独立又可组合的层次构成的完整体系。


三层 Agent 体系

长期状态管理到动态任务并行,再到多用户隔离,形成完整的 Runtime 能力栈

层次名称核心能力
第一层多 Profile 长期 Agent独立记忆、独立配置、独立工具状态
第二层子代理并行(Subagents)任务拆解、并发执行、多模型协作
第三层多用户 Session 隔离Per-user Context、会话状态独立


第一层:多个长期 Agent(Profile)

Profile 机制是 Hermes 最实用、上手成本最低的多 Agent 方式。你可以把它理解为:在同一台机器里运行多个真正隔离的长期 AI Worker,而不是简单地用不同 Prompt 扮演不同角色。

最大的区别在于:记忆是隔离的coder 不会记住 research 的聊天历史,ops 不会污染 coder 的上下文。这是绝大多数 Agent 框架做不到的事情——它们所谓的"多 Agent",本质上只是同一个上下文池里的角色扮演。

三个典型 Agent 示例

coder

  • 写代码 / PR Review
  • 自动修 Bug
  • MCP 开发工具链
  • 代码库长期上下文

ops

  • VPS / Docker 运维
  • Kubernetes 管理
  • 日志巡检 & 告警
  • 定时任务编排

research

  • 网页检索 & 摘要
  • 市场研究
  • 新闻追踪
  • 报告生成

创建与切换

# 创建多个长期 Agent
hermes profile create coder
hermes profile create ops
hermes profile create research

# 查看所有 Agent
hermes profile list

# 切换到指定 Agent
hermes -p coder
hermes -p ops

第二层:子代理并行(Subagents)

这是 Hermes 开始真正像 Agent Runtime 的地方。在一次任务中,主 Agent 可以自动拆解目标,动态拉起多个隔离子 Agent 并发执行,最后统一汇总结果。

这不是简单的多线程,而是具备认知分工能力的并行——每个子代理有自己的工具调用权限和上下文,互不干扰。

并行任务示例

任务:"分析英伟达、AMD、台积电财报,给出 AI 算力产业链结论"

主 Agent(规划 · 汇总 · 结论)
 ├── 子 Agent A:英伟达财报分析
 ├── 子 Agent B:AMD 财报分析
 └── 子 Agent C:台积电产业链分析
 ↓
 并发完成 · 统一汇总 · 输出最终报告

进阶:模型分层部署,大幅降低成本

子任务和最终决策可以使用不同量级的模型,在保证质量的同时显著降低成本。

层次职责推荐模型
子任务层(低成本)检索 / 摘要 / 分类GLM、Kimi、MiniMax
决策层(高质量)推理 / 汇总 / 长链决策GPT-5、Claude、DeepSeek R1

第三层:多用户 Session 隔离

对于需要多人共用同一 Hermes 实例的场景,Session 隔离至关重要。只需一行配置:

# hermes.config.yaml
group_sessions_per_user: true

开启后,不同用户各自拥有独立的上下文、记忆和会话状态。这解决了共享 Agent 系统最常见的三个问题:

  • 用户之间上下文串线
  • 历史记忆污染
  • 长期状态错乱

在团队协作或 SaaS 产品场景下,这一层的价值不可忽视。


三种推荐架构

选择的核心标准是:你更需要协作效率,还是隔离稳定性

架构结构适合场景隔离性协作性
主 Agent + 多 Profile(推荐)Router 分发给子 ProfileAI 团队协作、任务分工✅ 高✅ 高
完全独立多 Agent各 Profile 完全独立运行权限严格隔离、稳定优先✅ 极高❌ 低
Hermes + OpenClaw 共存OpenClaw 轻量 CLI + Hermes 长期运行高级用户、生产环境✅ 高✅ 高

关于架构三:Hermes + OpenClaw 共存

OpenClaw 保持轻量,负责本地 CLI 快速执行;Hermes 负责长期在线、自动化任务和多 Agent 编排。两套系统定位不同,互不冲突,组合后覆盖从快速迭代到长期运行的全场景。


Hermes 最厉害的地方

不是"支持很多模型",也不是配置灵活——而是它已经具备了 AI 基础设施的雏形。当多 Agent、多入口、长期记忆、子代理、任务编排这些能力组合在一起,Hermes 已经不是一个聊天工具,而是一个正在成形的 AI Operating System

核心差异总结

大多数框架的"多 Agent" = 同一个上下文池 + 不同 Prompt。

Hermes 的多 Agent = 真正隔离的长期状态 + 可编排的并发执行 + 多用户独立会话。

这是质的不同,不是量的差距。