GPT-5.6被一客一审，但Hermes这周把多模型混排做透了 | Hermes周报#11-酒店常州论坛

📢 这是「Hermes Agent 周报」第 11 期，每周一更新。
记录全球最活跃的开源 AI Agent 框架 Hermes Agent 的每周动态。
觉得有用就收藏+关注，不错过每周更新 👋

6 月 27 号，OpenAI 发了 GPT-5.6。

听起来是个大事对吧。但你猜怎么着——这模型你调不了。

不是价格的问题。是美国政府要求"一客一审"，首批只开放给大约 20 家"可信合作伙伴"。普通开发者连 API 都摸不到。

巧的是，同一天，Hermes 仓库里一条 commit 刚刚合进去：feat(moa): references see full tool state + fire on every user/tool response。MoA——Mixture of Agents，多模型混排——这周一口气吃了 20 个 commit，成了本期最大主题。

一个模型被锁死了怎么办？换一个。如果同时跑多个模型交叉验证呢？这就是 MoA 在干的事。

📊 本周数据（6 月 22 日 ~ 6 月 28 日）

指标	数值
总提交	927
贡献者	148
新功能	113
Bug修复	480
测试	59
构建/CI	45
文档	39
重构	27
性能优化	5
当前版本	v2026.6.19

热门模块排名：desktop（101）、gateway（71）、agent（44）、telegram（24）、release（22）、moa（20）、cron（20）、ci（19）、cli（17）、windows（16）。

这周没有新 release。但 927 个 commit、148 个人的投入量，说明 v0.18.0 的地基正在疯狂浇筑。

一句话总结：MoA 从"能用"变成"能看"——参考模型的输出第一次以独立块渲染出来，桌面端远程 gateway 打通，启动性能拉了一波大的，安全团队又堵了两个 P1。

🚀 重头戏：MoA 大改，多模型混排终于能看了

20 个 commit 全砸在 moa 模块上。我挑三条核心改动说。

参考模型输出可视化（3b44a3c8b+163cb24d4，@Teknium）——这是这周最直观的变化。之前 MoA 是个黑盒：你开了一堆参考模型，它们在后台跑了，最后吐一个聚合结果给你。中间每个模型说了什么，你不知道。

现在不一样了。每个参考模型的输出会以带标签的独立块（labelled block）渲染出来，排列在聚合结果之前。CLI、TUI、Desktop 三个端全支持。你终于能看见 GPT、Claude、GLM 各自的分析过程，再看到 MoA 怎么综合它们的。

说白了，从"信任黑盒"变成了"可审计的多模型协作"。

参考模型现在能看到完整工具状态（7c38249c7，@Teknium）——这条改动更深层。之前参考模型拿到的上下文是裁剪过的，看不到工具调用结果。现在它们能看到完整的 tool state，而且在每次 user/tool response 时都会触发。这意味着参考模型的判断质量直接上了一个台阶——它们不再是"凭空猜"，而是基于跟主 agent 同样的信息在做分析。

/moa改成 one-shot，预设切换走 model picker（50f685521，@teknium1）——之前/moa是个 toggle，开了就一直开着。现在改成一次性触发：你输入/moa，跑一轮多模型混排，完了就恢复。想换预设（比如从"编程模式"切到"分析模式"），直接在 model picker 里切。

这个改动看似小，但它让 MoA 的心智模型清晰了——它不是一种"模式"，而是一次"咨询"。你遇到拿不准的问题，拉一轮多模型看看各自怎么说，拿完结论继续干活。

你平时用 MoA 跑什么场景最多？代码 review？方案选型？还是翻译校对？评论区聊聊，我想看看大家的实际用法。

🖥️ 远程 Gateway：桌面端终于能操作远端仓库了

fc86e3576+c7542358f+4e9439cc3，@Brooklyn Nicholson | PR #54385

这条改动解决了一个实打实的痛点。

你在一台 Mac 上跑桌面端，但 Hermes 实际跑在一台远程 Linux 服务器上（通过 gateway 连接）。之前你想用桌面端的 git cockpit 看 commit 历史、review 代码、切 worktree——不行，因为文件系统是远程的，本地的 git 操作全废。

这周改了。git cockpit 现在能感知远程 gateway，文件系统和 git 操作都走远程路由。folder picker 也是远程感知的——你选的目录是远程机器上的路径，不是你本地 Mac 上的。

用大白话说：你的桌面端终于能当远程服务器的遥控器用了。不再是"能看到输出但碰不到文件"的半残状态。

这对在远程服务器上跑 Hermes 的人（应该不少）是个实打实的体验提升。

💬 WhatsApp 原生媒体投递

cd592c105，@Teknium | PR #53598

send_message工具现在支持通过 Baileys bridge 向 WhatsApp 发送图片、语音和文件了。之前 WhatsApp 渠道只能发文本，现在跟 Telegram、Teams、iMessage 看齐了。

加上上一期的 iMessage（Photon）和 Teams 原生附件，Hermes 的消息渠道矩阵又补了一块。

⚡ 启动性能：这个值得单独说

这周只有 5 个性能 commit，但密度很高。

优化	Commit	效果
libyaml CSafeLoader 解析配置	`980622d0e`	YAML 解析从纯 Python 换成 C 实现，启动快一截
网关平台适配器懒加载	`95f2919f9`	不再启动时全量加载所有平台插件，用到的才加载
会话切换快表加载	`c4c590e4a`	多会话场景下切换不再卡顿
延迟 resume 成默认	`3bf00e459`	会话恢复从阻塞式改成延迟式，不再卡启动
大输出渲染限流	`cbe5c5689`	`/learn`之类的大输出不再冻屏

单独看每条都是小优化。叠在一起，启动速度和日常流畅度会有体感级别的改善。尤其是"网关平台适配器懒加载"这条——如果你配了 Telegram、WhatsApp、iMessage、飞书一堆渠道，之前每次启动都得全部初始化，现在只加载你实际在用的。

🔒 安全：两个 P1 + 一波 SSRF 加固

这周安全修复不少，有两个标了 P1：

Telegram 未授权用户拦截（c648ecdca，@teknium1，PR #54164）——之前未授权用户的请求会走到 event 构造阶段才被拒。现在在更早的阶段就拦掉。这意味着恶意请求不会消耗资源做无用的消息解析。

浏览器私有网络守卫扩展（61210097a，@srojk34，PR #54435）——private-network guard 之前只覆盖部分浏览器工具，现在browser_get_images也纳入了。防止 agent 通过图片请求探测内网。

还有一个SSRF 守卫（d65468e7f，@Teknium，PR #54470）堵了元宝渠道的 media download_url——之前这个 URL 没做内网地址校验，理论上可以被 SSRF。

安全这件事在 Hermes 里不是"想起来补一下"，而是持续性的扫雷。几乎每周都有。

🐛 其他值得知道的修复

Gateway 重启后会话保留（86e64900b）——之前 gateway 重启会丢 session 状态，现在能跨重启保住了。如果你遇到过"gateway 一重启 agent 就失忆"，这周应该好了
Curator 不再归档 cron 引用的 skill（4c2961c51）——之前 curator 的自动清理逻辑会误删 cron 任务还在用的 skill，现在有保护了。这是个容易踩的坑——你的定时任务突然报"skill not found"，翻半天发现是被自动清理了
Anthropic base_url 残留修复（e7d4ade8c）——之前切到非 Anthropic 模型后，旧的 base_url 还在影响请求路由。现在所有路径都做了清理
Windows 控制台闪窗大扫除（ee22d853e等）——Windows 上每次跑 git、pdftoppm、skills hub 探测都会弹一个黑窗然后消失。这周做了全面覆盖，应该安静了

🌍 行业视角：当最强模型被锁在笼子里

这周三件事放一起看，信息量很大。

GPT-5.6 被政府"一客一审"。6 月 27 号发布，但美国要求逐个审批试用权限。首批只有约 20 家合作伙伴能用，普通开发者连排队入口都找不到。这已经不是第一次了——之前 Anthropic 的 Fable 5 和 Mythos 5 就被全球下架过。前沿模型正在从"谁都能调"变成"谁能调由政府说了算"。

Linux Foundation 拉了 19 家公司搞 Akrites。Anthropic、OpenAI、Google、Microsoft、AWS 全在列。目的：在 AI 驱动的攻击者之前，协调修复关键开源软件漏洞。翻译一下：AI 让漏洞挖掘速度暴涨，开源社区需要一个联合防御机制，不然就是"一个人挖洞，全世界打补丁"。

百度开源 Unlimited OCR。3B 参数、500M 激活、OmniDocBench v1.5 全球第一。作者是疑似从 DeepSeek 出走的 OCR 核心成员。一个比很多模型小一个数量级的模型，在端到端 OCR 上拿了 SOTA。

对 Hermes 用户来说，这三件事指向同一个方向：别把鸡蛋放在一个模型篮子里。

GPT-5.6 你调不了？Hermes 的 MoA 让你同时跑 GLM-5.2 + Claude + 开源模型。Anthropic 被下架了？换一个 provider 配置就行。这周 MoA 的改动让多模型混排从"概念验证"变成了"日常可用的生产力工具"——你能看到每个模型的推理过程，再决定信哪个。

这才是开源 agent 框架的护城河：不被任何单一模型的命运绑架。

你觉得多模型混排在实际使用中靠谱吗？会不会增加太多 API 开销？评论区说说你的顾虑，下一期我可以专门聊聊 MoA 的成本控制策略。

📈 升级建议

当前版本仍是v2026.6.19（v0.17.0），但本周 927 个 commit 全是 pre-v0.18.0 的在途开发。如果你想体验本周的 MoA 改动和性能优化，可以拉 nightly：

hermesupdate--channelnightly

如果用稳定版，当前 v0.17.0 也够用，等 v0.18.0 正式发布再升也不迟。

这周最值得亲自试的：把 MoA 打开跑一轮/moa，看看多模型参考输出渲染出来是什么效果。光看 changelog 感受不到那种"三个模型同时给你分析"的体感。

本文由「小星AI」整理发布，数据来源：NousResearch/hermes-agent
专栏持续更新中，欢迎订阅 ✨

企业官网建设流程全解析

📊 本周数据（6 月 22 日 ~ 6 月 28 日）

🚀 重头戏：MoA 大改，多模型混排终于能看了

🖥️ 远程 Gateway：桌面端终于能操作远端仓库了

💬 WhatsApp 原生媒体投递

⚡ 启动性能：这个值得单独说

🔒 安全：两个 P1 + 一波 SSRF 加固

🐛 其他值得知道的修复

🌍 行业视角：当最强模型被锁在笼子里

📈 升级建议

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

📊 本周数据（6 月 22 日 ~ 6 月 28 日）

🚀 重头戏：MoA 大改，多模型混排终于能看了

🖥️ 远程 Gateway：桌面端终于能操作远端仓库了

💬 WhatsApp 原生媒体投递

⚡ 启动性能：这个值得单独说

🔒 安全：两个 P1 + 一波 SSRF 加固

🐛 其他值得知道的修复

🌍 行业视角：当最强模型被锁在笼子里

📈 升级建议

热门文章

文章分类

标签云

相关文章

Rprocps-ng API接口详解：如何通过编程方式调用监控工具

openeuler/syskits性能优化指南：从二进制大小到执行效率的全方位调优

保姆级教程：用R语言mediation包搞定NHANES数据的中介效应分析（附代码）

需要专业的网站建设服务？