Hermes Agent 实战指南:从临时问答工具到长期工作的数字同事(收藏版)
2026/5/31 17:03:40 网站建设 项目流程

本文详细介绍了 Hermes Agent 的安装、模型选择、use case 应用、Dashboard 使用技巧等,强调其作为 24/7 持续工作的 AI 员工的特点。文章重点阐述了 Hermes 的本地透明记忆、长期会话召回、自主执行等核心功能,并通过实际案例展示了其如何将 AI 从临时问答工具提升到“长期工作的数字同事”层级。此外,还探讨了模型选择、消息平台配置、Kanban board 应用、self-improvement 等关键方面,为读者提供了全面的 Hermes Agent 使用指南。

一开头就把定位说得很重:

Hermes Agent 不是一个普通 AI 工具,而是一个 24/7 持续工作的 AI 员工。

不是刚用几天就来写教程。

Hermes 已经被连续跑了几个月。

所以这篇内容想讲的,不只是“功能有什么”。

而是:

  • 怎么安装
  • 模型怎么选
  • 哪些 use case 真正值得用
  • Dashboard 哪些地方 99% 的人其实都没用对
  • 什么才是 Hermes 真正的 edge
  • 安全问题到底怎么看

如果把整篇文章浓缩成一句话,我觉得它真正想表达的是:

Hermes 把 AI 从临时问答工具,拉到了“长期工作的数字同事”这个层级。

第一层:Hermes 到底是什么?

Hermes 的定义非常明确:

它是 Nous Research 做的一个 247 autonomous AI employee。

也就是:

  • 你睡觉时也能工作
  • 会主动找和你目标相关的任务去做
  • 而且每个 session 都会比上一个 session 更聪明一点

Hermes 和其他 agent 最大的差别主要在 3 个地方:

1)Memory 完全在本地 Markdown 文件里

不是在云端。

不是黑盒。

所有东西都存在你自己的电脑上。

你可以:

  • 读它
  • 改它
  • 删它

这点非常关键。

因为大多数“记忆型 agent”都让你相信系统记住了什么,但你并不能真正检查。

而 Hermes 的记忆层至少在形态上是透明的。

2)Self-improvement 是内置循环,不是额外插件

每完成一个任务,都会回看:

  • 什么做对了
  • 什么没做好
  • 下次怎么做更优

然后它会把这些经验写回自己的 skills。

也就是说,改进不是靠你每次重新写 prompt。

而是它把任务经验沉淀成下一次直接复用的工作方法。

3)Session recall 不只是上下文记忆,而是可搜索的长期历史

每次对话都会被记录下来。

底层是:

  • FTS5 全文检索
  • 再加 LLM summarization

所以你可以问:

我们 3 个月前聊过什么?

它真的能找出来。

这一层很有价值。

因为很多 agent 的“记忆”更多只是近程上下文延长,而不是真正的长期可召回工作历史。

第二层:Hermes、OpenClaw、Claude Code 各自适合什么?

没有说 Hermes 是万能替代品,而是把几个工具拆成不同工作类型。

Hermes vs OpenClaw

评价挺尖锐:

OpenClaw 变得臃肿、慢,而且更新容易把原有 setup 搞坏。

而 Hermes 更轻、更快、更新后不容易把环境打碎。

单是“可靠性”这一点,就足够成为现在切换的理由。

除此之外,还列了 Hermes 的一些额外优势:

  • Kanban 多 agent(v0.12.0+):agents 从 board 认领任务、并行工作、卡住时交接
  • Nous Portal:内置 curated models
  • 166 个已追踪 skills(87 bundled + 79 optional)
  • 20+ 消息平台:Telegram、Discord、Slack、WhatsApp、Signal、Matrix、Teams 等

Hermes vs Claude Code / Codex

定位非常清楚:

  • Hermes = 通用型 AI 员工 / Chief of Staff
  • Claude Code / Codex = 深度专注 coding session 工具

也就是:

Hermes 适合:

  • 日常事务
  • 研究
  • 文档
  • 表格
  • 电脑管理
  • 业务顾问
  • 原型搭建
  • 长期复盘和改进

而 Claude Code / Codex 适合:

  • 大规模复杂应用
  • 深度 vibe coding
  • 端到端测试
  • 两个窗口并排猛干的那种场景

这个区分我觉得非常合理。

Hermes 不是替代深度 coding agent,而是负责把那些“不是需要你整个人坐进去盯着干”的工作吞掉。

第三层:安装本身很简单,真正重要的是你后面怎么配置它

安装命令给得很直接。

Linux / macOS / WSL2:

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh

Windows PowerShell 也有安装脚本。

Android / Termux 也支持。

安装后运行:

hermes

它会走一次 quick setup,引导你:

  • 选模型
  • 选消息平台

如果你电脑里已经有 OpenClaw,它还会提供 memory import 选项。

建议:

最好从干净状态开始。

因为两个 agent 分开拥有自己的记忆和 skills,通常比混在一起更好。

第四层:模型选择不是“越贵越好”,而是任务匹配

模型分成三档。

1)贵:Claude Opus 4 / Sonnet 4

适合:

  • 复杂推理
  • 长 /goal 任务
  • 细腻写作
  • business advisor 角色

Claude 在“中途需要做判断”的任务上,处理模糊性最好。

如果要极致判断质量,用 Opus。

如果要更快、但保留 90% 体验,用 Sonnet。

缺点也很明确:

Anthropic 不再给 agent 用 OAuth,所以得走 API key,按 token 计费。

重度用下来,一个月可能就是几百美元。

2)中档:GPT-5.5

适合:

  • coding tasks
  • prototyping
  • 预算敏感型的 daily driver

GPT-5.5 才真正让 GPT 系列在 agent 里开始有用了。

而且如果你已经有 ChatGPT $20/月订阅,使用弹性通常比 Anthropic 更好。

建议很实用:

如果你刚开始玩 Hermes,就先从这里起步。

先看哪些任务真的需要升级到 Claude。

3)更便宜:Qwen 3.7 Max / Grok / Nous Portal

其中:

  • Qwen 3.7 Max:适合长时间 autonomous tasks,据说能连续跑 35 小时、1000+ tool calls 不丢上下文
  • Grok:如果你已经是 SuperGrok 用户,尤其适合和 X 相关任务
  • Nous Portal:$20/月,官方 curated models,一张账单,少管 API keys

给出了一个 quick reference 图。

而切模型很简单:

hermes model

这点也重要。

因为说明 Hermes 把模型切换做成了运行期操作,而不是 setup-level 决策。

第五层:消息平台别想太多,先上 Telegram

建议异常明确:

先用 Telegram。

原因是 Telegram 是少数真的还在持续为 AI agent 提供原生土壤的平台:

  • Topics
  • agent-to-agent communication
  • 新功能迭代
  • 免费

配置方式也不复杂:

  • 用 BotFather 拿 token
  • 填进 Hermes
  • 完成

大概五分钟。

当然它也支持 20+ 平台。

但态度是:

不要一开始就分心搞一堆 surface。

先把最顺手、生态最友好的入口跑起来。

第六层:第一天最该做的 3 件事

这部分很实用。

Hermes onboarding 总结成 3 步。

Step 1:先告诉 Hermes 你是谁

建议第一条消息就把这些信息讲清楚:

  • Name
  • What I do
  • What I’m building
  • My goals
  • How I work

这样这些信息会进入 memory。

之后 Hermes 所有主动做的事,都会被这些目标过滤。

如果跳过这一步,它就是在盲飞。

Step 2:立刻设一个 cron job

甚至给了一个很有意思的例子:

让 Hermes 每天凌晨 2 点给自己排一个任务,去做一个:

  • 能帮你更接近目标的 micro app / UI / system
  • 节省时间、提高效率,或者干脆单纯让你开心

意思其实很清楚:

你要尽快体验到“agent 在你不盯着时自己工作”的感觉。

否则 Hermes 很容易被你又用回一个普通聊天机器人。

Step 3:学会 /goal

说得很明确:

/goal 是 Hermes 最强命令。

它会把 Hermes 从 reactive chatbot 直接变成 background worker。

核心命令包括:

  • /goal [description]
  • /goal status
  • /goal pause
  • /goal resume
  • /goal clear
  • /subgoal [text]

这一层其实就是把“任务”从单轮对话,升级成持续执行的 objective。

第七层:Dashboard 为什么 99% 的人都没用对

运行:

hermes dashboard

浏览器会打开localhost:9119

但强调,绝大多数人打开 dashboard 后都没抓住重点。

真正第一眼应该去看的是 Skills tab。

因为在那里你才能看到 Hermes 真正学会了什么。

Models tab

可视化切模型,不用回终端。

不同 profile 还能配不同模型。

Cron tab

看所有计划任务。

手动配置时比纯文字命令更精细。

Skills tab

这是价值核心。

你可以看到:

  • Hermes 学到的每个 skill
  • Markdown 内容本身
  • 哪些开、哪些关

一个被长期使用的 agent,通常会长出 150+ skills。

这意味着它不仅会做事,而且已经学会了你的具体工作方式。

建议一上来就打开这些:

  • browser automation
  • computer use
  • image generation
  • video generation

Plugins tab

额外能力入口,比如:

  • browser-use
  • firecrawl
  • computer-use
  • 各类 API key 集成

Profiles tab

这其实就是 multi-agent 入口。

一个 profile = 一个 Hermes agent。

每个 agent 有:

  • 自己的 memory
  • 自己的 skills
  • 自己的 model

建议你可以按角色来配:

  • Chief of Staff
  • Head of Content
  • Research Agent
  • DevOps Engineer

然后同时运行。

这已经很像一个 mini org chart 了。

第八层:Kanban board 才是 multi-agent 真正落地的地方

特别强调了 Kanban board 的用法。

建议每天早上把 to-do list 里那些 AI 能处理的任务,全丢进Triage

然后你去做早餐。

系统会自动:

  1. 1. Hermes 从 Triage 拿任务

  2. 2. 拆成 subtasks

  3. 3. 移到 To-Do

  4. 4. 分配给 sub-agents

  5. 5. 并行执行

等你早餐回来,待办已经做掉一半。

这个场景其实就是理想状态:

AI 不只是“回答问题”。

而是接管了任务流本身。

第九层:Use Cases——Hermes 最适合用来做什么?

列了不少 use case,我挑最有代表性的说。

1)Daily Tutor

给它一个 YouTube 视频,它读 transcript,然后每天早上 8 点:

  • 提醒你一个概念
  • 再 quiz 你

这类 use case 本质上是在利用:

  • transcript retrieval
  • cron
  • memory
  • recurring delivery

2)Computer Administrator

如果你在所有设备上装了 Tailscale,Hermes 就能跨机器操作。

比如:

把我 Mac Studio 上的某个文件拿出来,丢到 MacBook Pro 上

这种 use case 特别适合把 Hermes 变成你的跨设备文件和环境协调员。

3)Session Recall

问:

上个月我们聊过哪些 business ideas?

它可以直接从历史里挖回来。

这是很多 agent 根本做不到的。

4)X Content Workflow with xurl

提到一个很有代表性的 workflow:

让 Hermes 早晚各做一次:

  • 研究最新 AI agent 讨论
  • 对照你的内容风格
  • 检查之前发过的主题
  • 起草 thread
  • 打分 virality
  • 合格才通过 xurl 发布

这就把内容生产变成了 recurring content system。

5)Mission Control

你甚至可以让 Hermes 给你直接搭一个自己的 dashboard:

  • 内容 pipeline
  • memory wiki
  • artifacts docs page

这已经不只是执行任务,而是在替你造 interface。

6)Prototype Builder

在健身房想到个 idea,直接在 Telegram 发:

给我做一个 landing page prototype

回头一个小时后回来,原型已经在 localhost 跑好了。

7)Business Advisor

和 ChatGPT 不同的是,Hermes 给建议时会带着:

  • 你的业务背景
  • 你的目标
  • 你的约束

所以它不是 generic framework advice,而是针对你自己的情境。

8)Overnight /goal Runs

睡前给一个复杂目标:

  • competitor research
  • pricing / feature / content / team size / recent news
  • 输出结构化 markdown 文档

早上起来直接收结果。

9)Multi-Agent Org Chart

最后把多 agent 组织方式讲得很具体:

  • Chief of Staff:协调其他 agents,早上 7 点做 morning brief
  • Head of Research:监控 X、跟踪竞争对手、出 intelligence brief
  • Head of Content:基于研究简报产出内容

最后你只读一个汇总。

这其实就是“AI 组织图”的雏形。

第十层:Self-Improvement 才是 Hermes 真正的 edge

最看重的,其实不是上面那些 use case。

而是 self-improvement loop。

这个循环是:

  1. 1. 你给 Hermes 一个任务

  2. 2. 它执行

  3. 3. 完成后它复盘:什么有效、什么无效、最佳路径是什么

  4. 4. 它把经验存成 skill 到~/.hermes/skills/

  5. 5. 下次遇到同类任务,直接调用 skill

总结很有力量:

你纠正它一次,它以后就不再犯这个错。

跑上 6 个月之后,Hermes 会比人类助理更了解你的工作方式:

  • 你喜欢什么格式
  • 哪些工具最适合你的流程
  • 什么语气该用在哪些场景
  • 哪些捷径能走、哪些不能走

而这些 skills 又全都是透明 Markdown 文件。

所以它的学习过程是可检查、可编辑的。

这确实是很多 agent 系统目前还没真正做好的部分。

最后一层:安全问题,看法其实很直接

对 Hermes 的安全焦虑持相对“去神秘化”的态度。

基础用法下,安全风险被夸大了。

因为 Hermes 本质上只会做你让它做的事。

你让它做 presentation,它不会自己打开你照片文件夹。

真正灾难性的安全事故,大多来自你自己给了灾难性指令。

所以建议反而很朴素:

  • 保持常识
  • 对 destructive prompts 先看一眼再回车
  • 在 soul.md 写清楚底线,比如“没有明确确认绝不转钱”

而不是为了“更安全”去额外搞:

  • 单独 iCloud 账号
  • 单独 Google 账号
  • VPS(他甚至吐槽不少 AI YouTuber 推荐 VPS,其实是赞助内容)

他的结论是:

个人用法下,把它装在主力机上,带着常识使用,就够了。

如果出问题,就直接把 Hermes 文件夹丢给 Claude Code / Codex 让它修。

我的看法:这篇最重要的,不是 Hermes 的功能列表,而是它展示了一种“让 agent 长期工作”的结构

这篇文章表面上是在讲 Hermes。

但它真正有价值的地方,是它把“长期型 agent”该具备的结构讲得很完整:

  • 本地透明记忆
  • 长期会话召回
  • /goal 驱动的自主执行
  • cron 驱动的持续任务
  • profiles 形成多 agent 角色分工
  • Kanban 驱动任务流
  • skills 驱动经验沉淀
  • self-improvement 驱动真正复利

也就是说,真正让一个 agent 像“AI 员工”的,不是它某次回答多聪明。

而是:

它是否能在一段时间里,越来越懂你、越来越会做、越来越少重复犯错。

Hermes 想做的,恰恰是这一层。

最后一句

如果你现在对 AI 的使用方式,还主要停留在:

  • 打开一个聊天框
  • 问一句
  • 收一个答案
  • 关掉

那 Hermes 这类系统真正提供的,不是“更强的聊天能力”。

而是一种新的工作关系:

你不是在用一个工具。
你是在训练、调度、观察并逐步培养一个会持续工作的数字同事。

而这,才是这篇指南最值得看的地方。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包

  • ✅ 从零到一的 AI 学习路径图
  • ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
  • ✅ 百度/阿里专家闭门录播课
  • ✅ 大模型当下最新行业报告
  • ✅ 真实大厂面试真题
  • ✅ 2026 最新岗位需求图谱

所有资料 ⚡️ ,朋友们如果有需要《AI大模型入门+进阶学习资源包》下方扫码获取~

① 全套AI大模型应用开发视频教程

(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)

② 大模型系统化学习路线

作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!

③ 大模型学习书籍&文档

学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。

④ AI大模型最新行业报告

2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

⑤ 大模型项目实战&配套源码

学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

⑥ 大模型大厂面试真题

面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余

以上资料如何领取?

为什么大家都在学大模型?

最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!

不出1年,“有AI项目经验”将成为投递简历的门槛。

风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!

这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

以上全套大模型资料如何领取?

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询