GPT-5.6被一客一审,但Hermes这周把多模型混排做透了 | Hermes周报#11
2026/6/30 17:57:23 网站建设 项目流程

📢 这是「Hermes Agent 周报」第 11 期,每周一更新。
记录全球最活跃的开源 AI Agent 框架 Hermes Agent 的每周动态。
觉得有用就收藏+关注,不错过每周更新 👋

6 月 27 号,OpenAI 发了 GPT-5.6。

听起来是个大事对吧。但你猜怎么着——这模型你调不了。

不是价格的问题。是美国政府要求"一客一审",首批只开放给大约 20 家"可信合作伙伴"。普通开发者连 API 都摸不到。

巧的是,同一天,Hermes 仓库里一条 commit 刚刚合进去:feat(moa): references see full tool state + fire on every user/tool response。MoA——Mixture of Agents,多模型混排——这周一口气吃了 20 个 commit,成了本期最大主题。

一个模型被锁死了怎么办?换一个。如果同时跑多个模型交叉验证呢?这就是 MoA 在干的事。

📊 本周数据(6 月 22 日 ~ 6 月 28 日)

指标数值
总提交927
贡献者148
新功能113
Bug修复480
测试59
构建/CI45
文档39
重构27
性能优化5
当前版本v2026.6.19

热门模块排名:desktop(101)、gateway(71)、agent(44)、telegram(24)、release(22)、moa(20)、cron(20)、ci(19)、cli(17)、windows(16)。

这周没有新 release。但 927 个 commit、148 个人的投入量,说明 v0.18.0 的地基正在疯狂浇筑。

一句话总结:MoA 从"能用"变成"能看"——参考模型的输出第一次以独立块渲染出来,桌面端远程 gateway 打通,启动性能拉了一波大的,安全团队又堵了两个 P1。

🚀 重头戏:MoA 大改,多模型混排终于能看了

20 个 commit 全砸在 moa 模块上。我挑三条核心改动说。

参考模型输出可视化3b44a3c8b+163cb24d4,@Teknium)——这是这周最直观的变化。之前 MoA 是个黑盒:你开了一堆参考模型,它们在后台跑了,最后吐一个聚合结果给你。中间每个模型说了什么,你不知道。

现在不一样了。每个参考模型的输出会以带标签的独立块(labelled block)渲染出来,排列在聚合结果之前。CLI、TUI、Desktop 三个端全支持。你终于能看见 GPT、Claude、GLM 各自的分析过程,再看到 MoA 怎么综合它们的。

说白了,从"信任黑盒"变成了"可审计的多模型协作"。

参考模型现在能看到完整工具状态7c38249c7,@Teknium)——这条改动更深层。之前参考模型拿到的上下文是裁剪过的,看不到工具调用结果。现在它们能看到完整的 tool state,而且在每次 user/tool response 时都会触发。这意味着参考模型的判断质量直接上了一个台阶——它们不再是"凭空猜",而是基于跟主 agent 同样的信息在做分析。

/moa改成 one-shot,预设切换走 model picker50f685521,@teknium1)——之前/moa是个 toggle,开了就一直开着。现在改成一次性触发:你输入/moa,跑一轮多模型混排,完了就恢复。想换预设(比如从"编程模式"切到"分析模式"),直接在 model picker 里切。

这个改动看似小,但它让 MoA 的心智模型清晰了——它不是一种"模式",而是一次"咨询"。你遇到拿不准的问题,拉一轮多模型看看各自怎么说,拿完结论继续干活。

你平时用 MoA 跑什么场景最多?代码 review?方案选型?还是翻译校对?评论区聊聊,我想看看大家的实际用法。

🖥️ 远程 Gateway:桌面端终于能操作远端仓库了

fc86e3576+c7542358f+4e9439cc3,@Brooklyn Nicholson | PR #54385

这条改动解决了一个实打实的痛点。

你在一台 Mac 上跑桌面端,但 Hermes 实际跑在一台远程 Linux 服务器上(通过 gateway 连接)。之前你想用桌面端的 git cockpit 看 commit 历史、review 代码、切 worktree——不行,因为文件系统是远程的,本地的 git 操作全废。

这周改了。git cockpit 现在能感知远程 gateway,文件系统和 git 操作都走远程路由。folder picker 也是远程感知的——你选的目录是远程机器上的路径,不是你本地 Mac 上的。

用大白话说:你的桌面端终于能当远程服务器的遥控器用了。不再是"能看到输出但碰不到文件"的半残状态。

这对在远程服务器上跑 Hermes 的人(应该不少)是个实打实的体验提升。

💬 WhatsApp 原生媒体投递

cd592c105,@Teknium | PR #53598

send_message工具现在支持通过 Baileys bridge 向 WhatsApp 发送图片、语音和文件了。之前 WhatsApp 渠道只能发文本,现在跟 Telegram、Teams、iMessage 看齐了。

加上上一期的 iMessage(Photon)和 Teams 原生附件,Hermes 的消息渠道矩阵又补了一块。

⚡ 启动性能:这个值得单独说

这周只有 5 个性能 commit,但密度很高。

优化Commit效果
libyaml CSafeLoader 解析配置980622d0eYAML 解析从纯 Python 换成 C 实现,启动快一截
网关平台适配器懒加载95f2919f9不再启动时全量加载所有平台插件,用到的才加载
会话切换快表加载c4c590e4a多会话场景下切换不再卡顿
延迟 resume 成默认3bf00e459会话恢复从阻塞式改成延迟式,不再卡启动
大输出渲染限流cbe5c5689/learn之类的大输出不再冻屏

单独看每条都是小优化。叠在一起,启动速度和日常流畅度会有体感级别的改善。尤其是"网关平台适配器懒加载"这条——如果你配了 Telegram、WhatsApp、iMessage、飞书一堆渠道,之前每次启动都得全部初始化,现在只加载你实际在用的。

🔒 安全:两个 P1 + 一波 SSRF 加固

这周安全修复不少,有两个标了 P1:

Telegram 未授权用户拦截c648ecdca,@teknium1,PR #54164)——之前未授权用户的请求会走到 event 构造阶段才被拒。现在在更早的阶段就拦掉。这意味着恶意请求不会消耗资源做无用的消息解析。

浏览器私有网络守卫扩展61210097a,@srojk34,PR #54435)——private-network guard 之前只覆盖部分浏览器工具,现在browser_get_images也纳入了。防止 agent 通过图片请求探测内网。

还有一个SSRF 守卫d65468e7f,@Teknium,PR #54470)堵了元宝渠道的 media download_url——之前这个 URL 没做内网地址校验,理论上可以被 SSRF。

安全这件事在 Hermes 里不是"想起来补一下",而是持续性的扫雷。几乎每周都有。

🐛 其他值得知道的修复

  • Gateway 重启后会话保留86e64900b)——之前 gateway 重启会丢 session 状态,现在能跨重启保住了。如果你遇到过"gateway 一重启 agent 就失忆",这周应该好了
  • Curator 不再归档 cron 引用的 skill4c2961c51)——之前 curator 的自动清理逻辑会误删 cron 任务还在用的 skill,现在有保护了。这是个容易踩的坑——你的定时任务突然报"skill not found",翻半天发现是被自动清理了
  • Anthropic base_url 残留修复e7d4ade8c)——之前切到非 Anthropic 模型后,旧的 base_url 还在影响请求路由。现在所有路径都做了清理
  • Windows 控制台闪窗大扫除ee22d853e等)——Windows 上每次跑 git、pdftoppm、skills hub 探测都会弹一个黑窗然后消失。这周做了全面覆盖,应该安静了

🌍 行业视角:当最强模型被锁在笼子里

这周三件事放一起看,信息量很大。

GPT-5.6 被政府"一客一审"。6 月 27 号发布,但美国要求逐个审批试用权限。首批只有约 20 家合作伙伴能用,普通开发者连排队入口都找不到。这已经不是第一次了——之前 Anthropic 的 Fable 5 和 Mythos 5 就被全球下架过。前沿模型正在从"谁都能调"变成"谁能调由政府说了算"。

Linux Foundation 拉了 19 家公司搞 Akrites。Anthropic、OpenAI、Google、Microsoft、AWS 全在列。目的:在 AI 驱动的攻击者之前,协调修复关键开源软件漏洞。翻译一下:AI 让漏洞挖掘速度暴涨,开源社区需要一个联合防御机制,不然就是"一个人挖洞,全世界打补丁"。

百度开源 Unlimited OCR。3B 参数、500M 激活、OmniDocBench v1.5 全球第一。作者是疑似从 DeepSeek 出走的 OCR 核心成员。一个比很多模型小一个数量级的模型,在端到端 OCR 上拿了 SOTA。

对 Hermes 用户来说,这三件事指向同一个方向:别把鸡蛋放在一个模型篮子里

GPT-5.6 你调不了?Hermes 的 MoA 让你同时跑 GLM-5.2 + Claude + 开源模型。Anthropic 被下架了?换一个 provider 配置就行。这周 MoA 的改动让多模型混排从"概念验证"变成了"日常可用的生产力工具"——你能看到每个模型的推理过程,再决定信哪个。

这才是开源 agent 框架的护城河:不被任何单一模型的命运绑架。

你觉得多模型混排在实际使用中靠谱吗?会不会增加太多 API 开销?评论区说说你的顾虑,下一期我可以专门聊聊 MoA 的成本控制策略。

📈 升级建议

当前版本仍是v2026.6.19(v0.17.0),但本周 927 个 commit 全是 pre-v0.18.0 的在途开发。如果你想体验本周的 MoA 改动和性能优化,可以拉 nightly:

hermesupdate--channelnightly

如果用稳定版,当前 v0.17.0 也够用,等 v0.18.0 正式发布再升也不迟。

这周最值得亲自试的:把 MoA 打开跑一轮/moa,看看多模型参考输出渲染出来是什么效果。光看 changelog 感受不到那种"三个模型同时给你分析"的体感。

本文由「小星AI」整理发布,数据来源:NousResearch/hermes-agent
专栏持续更新中,欢迎订阅 ✨

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询