📢 这是「Hermes Agent 周报」第 11 期,每周一更新。
记录全球最活跃的开源 AI Agent 框架 Hermes Agent 的每周动态。
觉得有用就收藏+关注,不错过每周更新 👋
6 月 27 号,OpenAI 发了 GPT-5.6。
听起来是个大事对吧。但你猜怎么着——这模型你调不了。
不是价格的问题。是美国政府要求"一客一审",首批只开放给大约 20 家"可信合作伙伴"。普通开发者连 API 都摸不到。
巧的是,同一天,Hermes 仓库里一条 commit 刚刚合进去:feat(moa): references see full tool state + fire on every user/tool response。MoA——Mixture of Agents,多模型混排——这周一口气吃了 20 个 commit,成了本期最大主题。
一个模型被锁死了怎么办?换一个。如果同时跑多个模型交叉验证呢?这就是 MoA 在干的事。
📊 本周数据(6 月 22 日 ~ 6 月 28 日)
| 指标 | 数值 |
|---|---|
| 总提交 | 927 |
| 贡献者 | 148 |
| 新功能 | 113 |
| Bug修复 | 480 |
| 测试 | 59 |
| 构建/CI | 45 |
| 文档 | 39 |
| 重构 | 27 |
| 性能优化 | 5 |
| 当前版本 | v2026.6.19 |
热门模块排名:desktop(101)、gateway(71)、agent(44)、telegram(24)、release(22)、moa(20)、cron(20)、ci(19)、cli(17)、windows(16)。
这周没有新 release。但 927 个 commit、148 个人的投入量,说明 v0.18.0 的地基正在疯狂浇筑。
一句话总结:MoA 从"能用"变成"能看"——参考模型的输出第一次以独立块渲染出来,桌面端远程 gateway 打通,启动性能拉了一波大的,安全团队又堵了两个 P1。
🚀 重头戏:MoA 大改,多模型混排终于能看了
20 个 commit 全砸在 moa 模块上。我挑三条核心改动说。
参考模型输出可视化(3b44a3c8b+163cb24d4,@Teknium)——这是这周最直观的变化。之前 MoA 是个黑盒:你开了一堆参考模型,它们在后台跑了,最后吐一个聚合结果给你。中间每个模型说了什么,你不知道。
现在不一样了。每个参考模型的输出会以带标签的独立块(labelled block)渲染出来,排列在聚合结果之前。CLI、TUI、Desktop 三个端全支持。你终于能看见 GPT、Claude、GLM 各自的分析过程,再看到 MoA 怎么综合它们的。
说白了,从"信任黑盒"变成了"可审计的多模型协作"。
参考模型现在能看到完整工具状态(7c38249c7,@Teknium)——这条改动更深层。之前参考模型拿到的上下文是裁剪过的,看不到工具调用结果。现在它们能看到完整的 tool state,而且在每次 user/tool response 时都会触发。这意味着参考模型的判断质量直接上了一个台阶——它们不再是"凭空猜",而是基于跟主 agent 同样的信息在做分析。
/moa改成 one-shot,预设切换走 model picker(50f685521,@teknium1)——之前/moa是个 toggle,开了就一直开着。现在改成一次性触发:你输入/moa,跑一轮多模型混排,完了就恢复。想换预设(比如从"编程模式"切到"分析模式"),直接在 model picker 里切。
这个改动看似小,但它让 MoA 的心智模型清晰了——它不是一种"模式",而是一次"咨询"。你遇到拿不准的问题,拉一轮多模型看看各自怎么说,拿完结论继续干活。
你平时用 MoA 跑什么场景最多?代码 review?方案选型?还是翻译校对?评论区聊聊,我想看看大家的实际用法。
🖥️ 远程 Gateway:桌面端终于能操作远端仓库了
fc86e3576+c7542358f+4e9439cc3,@Brooklyn Nicholson | PR #54385
这条改动解决了一个实打实的痛点。
你在一台 Mac 上跑桌面端,但 Hermes 实际跑在一台远程 Linux 服务器上(通过 gateway 连接)。之前你想用桌面端的 git cockpit 看 commit 历史、review 代码、切 worktree——不行,因为文件系统是远程的,本地的 git 操作全废。
这周改了。git cockpit 现在能感知远程 gateway,文件系统和 git 操作都走远程路由。folder picker 也是远程感知的——你选的目录是远程机器上的路径,不是你本地 Mac 上的。
用大白话说:你的桌面端终于能当远程服务器的遥控器用了。不再是"能看到输出但碰不到文件"的半残状态。
这对在远程服务器上跑 Hermes 的人(应该不少)是个实打实的体验提升。
💬 WhatsApp 原生媒体投递
cd592c105,@Teknium | PR #53598
send_message工具现在支持通过 Baileys bridge 向 WhatsApp 发送图片、语音和文件了。之前 WhatsApp 渠道只能发文本,现在跟 Telegram、Teams、iMessage 看齐了。
加上上一期的 iMessage(Photon)和 Teams 原生附件,Hermes 的消息渠道矩阵又补了一块。
⚡ 启动性能:这个值得单独说
这周只有 5 个性能 commit,但密度很高。
| 优化 | Commit | 效果 |
|---|---|---|
| libyaml CSafeLoader 解析配置 | 980622d0e | YAML 解析从纯 Python 换成 C 实现,启动快一截 |
| 网关平台适配器懒加载 | 95f2919f9 | 不再启动时全量加载所有平台插件,用到的才加载 |
| 会话切换快表加载 | c4c590e4a | 多会话场景下切换不再卡顿 |
| 延迟 resume 成默认 | 3bf00e459 | 会话恢复从阻塞式改成延迟式,不再卡启动 |
| 大输出渲染限流 | cbe5c5689 | /learn之类的大输出不再冻屏 |
单独看每条都是小优化。叠在一起,启动速度和日常流畅度会有体感级别的改善。尤其是"网关平台适配器懒加载"这条——如果你配了 Telegram、WhatsApp、iMessage、飞书一堆渠道,之前每次启动都得全部初始化,现在只加载你实际在用的。
🔒 安全:两个 P1 + 一波 SSRF 加固
这周安全修复不少,有两个标了 P1:
Telegram 未授权用户拦截(c648ecdca,@teknium1,PR #54164)——之前未授权用户的请求会走到 event 构造阶段才被拒。现在在更早的阶段就拦掉。这意味着恶意请求不会消耗资源做无用的消息解析。
浏览器私有网络守卫扩展(61210097a,@srojk34,PR #54435)——private-network guard 之前只覆盖部分浏览器工具,现在browser_get_images也纳入了。防止 agent 通过图片请求探测内网。
还有一个SSRF 守卫(d65468e7f,@Teknium,PR #54470)堵了元宝渠道的 media download_url——之前这个 URL 没做内网地址校验,理论上可以被 SSRF。
安全这件事在 Hermes 里不是"想起来补一下",而是持续性的扫雷。几乎每周都有。
🐛 其他值得知道的修复
- Gateway 重启后会话保留(
86e64900b)——之前 gateway 重启会丢 session 状态,现在能跨重启保住了。如果你遇到过"gateway 一重启 agent 就失忆",这周应该好了 - Curator 不再归档 cron 引用的 skill(
4c2961c51)——之前 curator 的自动清理逻辑会误删 cron 任务还在用的 skill,现在有保护了。这是个容易踩的坑——你的定时任务突然报"skill not found",翻半天发现是被自动清理了 - Anthropic base_url 残留修复(
e7d4ade8c)——之前切到非 Anthropic 模型后,旧的 base_url 还在影响请求路由。现在所有路径都做了清理 - Windows 控制台闪窗大扫除(
ee22d853e等)——Windows 上每次跑 git、pdftoppm、skills hub 探测都会弹一个黑窗然后消失。这周做了全面覆盖,应该安静了
🌍 行业视角:当最强模型被锁在笼子里
这周三件事放一起看,信息量很大。
GPT-5.6 被政府"一客一审"。6 月 27 号发布,但美国要求逐个审批试用权限。首批只有约 20 家合作伙伴能用,普通开发者连排队入口都找不到。这已经不是第一次了——之前 Anthropic 的 Fable 5 和 Mythos 5 就被全球下架过。前沿模型正在从"谁都能调"变成"谁能调由政府说了算"。
Linux Foundation 拉了 19 家公司搞 Akrites。Anthropic、OpenAI、Google、Microsoft、AWS 全在列。目的:在 AI 驱动的攻击者之前,协调修复关键开源软件漏洞。翻译一下:AI 让漏洞挖掘速度暴涨,开源社区需要一个联合防御机制,不然就是"一个人挖洞,全世界打补丁"。
百度开源 Unlimited OCR。3B 参数、500M 激活、OmniDocBench v1.5 全球第一。作者是疑似从 DeepSeek 出走的 OCR 核心成员。一个比很多模型小一个数量级的模型,在端到端 OCR 上拿了 SOTA。
对 Hermes 用户来说,这三件事指向同一个方向:别把鸡蛋放在一个模型篮子里。
GPT-5.6 你调不了?Hermes 的 MoA 让你同时跑 GLM-5.2 + Claude + 开源模型。Anthropic 被下架了?换一个 provider 配置就行。这周 MoA 的改动让多模型混排从"概念验证"变成了"日常可用的生产力工具"——你能看到每个模型的推理过程,再决定信哪个。
这才是开源 agent 框架的护城河:不被任何单一模型的命运绑架。
你觉得多模型混排在实际使用中靠谱吗?会不会增加太多 API 开销?评论区说说你的顾虑,下一期我可以专门聊聊 MoA 的成本控制策略。
📈 升级建议
当前版本仍是v2026.6.19(v0.17.0),但本周 927 个 commit 全是 pre-v0.18.0 的在途开发。如果你想体验本周的 MoA 改动和性能优化,可以拉 nightly:
hermesupdate--channelnightly如果用稳定版,当前 v0.17.0 也够用,等 v0.18.0 正式发布再升也不迟。
这周最值得亲自试的:把 MoA 打开跑一轮/moa,看看多模型参考输出渲染出来是什么效果。光看 changelog 感受不到那种"三个模型同时给你分析"的体感。
本文由「小星AI」整理发布,数据来源:NousResearch/hermes-agent
专栏持续更新中,欢迎订阅 ✨