收藏！轻松上手大模型Agent开发：Anthropic Managed Agents揭秘高效运行时-酒店常州论坛

本文探讨了Anthropic如何将复杂的agent runtime转化为开发者可直接调用的基础设施。文章指出，agent开发的关键难点在于运行时环境而非模型本身，并介绍了Anthropic的Managed Agents如何通过将系统拆分为"大脑"（模型+harness）、“双手”（sandbox和工具）和"会话"（持久化日志）三个部分，实现"脑手分离"。这种设计不仅提升了系统的稳定性和恢复能力，还增强了安全性，例如通过将凭证与执行环境隔离来降低风险。Managed Agents为开发者提供了更灵活、高效的agent开发方式，特别适合需要长期运行、恢复、追踪事件历史以及接入自定义资源的应用场景。

Anthropic 正在把最难做的 agent runtime，变成开发者可以直接调用的基础设施。

Agent 的真正难点，不在模型，在“脏活累活”

你有这种感觉吗？

做一个 Agent Demo，其实已经不难了。

给模型一个 system prompt，配几个工具，接上代码执行或者浏览器，一个下午就能跑起来。

可一旦你想把它真正用到生产里，问题马上就来了：

• 跑了 40 分钟，容器挂了，之前的状态全没了
• 想连你自己的 VPC、数据库、内部服务，发现整个运行时耦死了
• Agent 需要 Git、OAuth、MCP 凭据，但你又不敢把 token 暴露给它执行的代码
• 上下文一长，模型记不住；你做了压缩，又怕把关键细节压没了

问题出在哪儿？

很多人以为难点在 prompt，不全对。

真正难的是 Agent 外面那层“壳”。

Anthropic 在这篇工程文章里用的词是harness。你可以把它理解成 Agent 的运行时总控层：怎么调模型、怎么接工具、怎么记状态、怎么恢复、怎么隔离安全边界，都是它在管。

只靠更强模型行吗？不行。模型变强了，旧 harness 里的假设会过时，甚至变成累赘。
只靠多堆几个容器行吗？也不行。状态、权限、恢复、调试，还是一团乱。

今天我想聊的，就是 Anthropic 最近放出来的新东西：Managed Agents。

它不是“又一个 Agent Demo SDK”，更像是把 agent runtime 这层基础设施，正式产品化了。

01 Managed Agents 到底是什么？

按官方文档，Claude Managed Agents 主要围绕 4 个对象展开：

对象	它负责什么
`Agent`	模型、system prompt、tools、MCP servers、skills
`Environment`	运行容器模板，比如安装什么包、能不能联网、挂载什么文件
`Session`	一次正在运行的 agent 实例，负责跨多轮保留历史
`Events`	你的应用和 agent 之间交换的事件，比如用户消息、工具结果、状态更新

这个拆法很关键。

以前很多团队写 agent，习惯把这些东西揉成一坨：提示词在代码里，容器跟状态绑在一起，工具调用和日志混在一起，出问题只能进容器里“抢救现场”。

Managed Agents 的想法是反过来：

把“Agent 定义”“运行环境”“运行过程”“事件日志”拆成稳定接口。

这样一来，你不是每次都重新造一套 agent 系统，而是在官方抽象上组装它。

02 Anthropic 这次真正拆掉的，是“宠物容器”

这篇工程文章里我最喜欢的一段，是他们承认自己一开始也踩了经典坑：

他们最早把 session、harness、sandbox 全塞进同一个容器里。

短期看很省事。Claude 改文件是直接 syscall，也没有复杂的服务边界。

但很快，这个容器就从“牛群”变成了“宠物”。

也就是说，它变成了那个你不能丢、挂了得人工抢救、出问题难排查的关键单点。

一旦容器失联：

• session 可能一起丢
• 调试只能看 WebSocket 事件流
• 你分不清是 harness 卡住了、网络掉包了，还是容器本身死了
• 工程师真要排查，还得进容器开 shell

这对托管式 Agent 服务来说，太重了。

所以 Anthropic 最终做的，是把整个系统拆成 3 层：

•brain：Claude + harness
•hands：sandbox 和各种 tools
•session：持久化事件日志

这就是文章标题里那句很形象的话：

Decoupling the brain from the hands。

简单讲，就是让“大脑”别再住在“手”里面。

03 为什么“脑手分离”这么重要？

1. 出故障时，不用再救容器

Anthropic 把 sandbox 看成一个标准工具接口，本质上像这样：

execute(name, input) -> string

如果容器挂了，harness 只会把它当成一次工具调用失败。Claude 可以选择重试，系统也可以重新按配方去 provision 一个新环境。

换句话说，容器终于从“宠物”变回“牛”了。

2. Harness 挂了，也能从日志里醒过来

session log 被挪到了 harness 外面。

这意味着 orchestrator/harness 本身可以是无状态的。哪怕某个 brain 进程崩了，也可以重新wake(sessionId)，再从getEvents()拿回事件流继续干。

这个设计特别像成熟分布式系统里的思路：

进程可以死，状态要活。

3. 凭据不再暴露给 Agent 自己写的代码

这部分是我觉得最有价值的地方。

过去如果 Claude 生成的代码和凭据在同一个 sandbox 里，一次 prompt injection 成功后，攻击者真正想拿的往往不是你的文件，而是 token。

Anthropic 的结构性修复是：

让 token 永远碰不到 sandbox。

官方给了两种模式：

• Git token 在环境初始化时就配置好，让git pull/push能用，但 agent 看不到 token 本身
• OAuth/MCP 凭据放在 sandbox 外的 vault 里，通过代理去调用外部服务

这不是“小心一点别泄露”的问题，而是直接从架构上把风险面缩小了。

4. Session 不等于上下文窗口

这也是文章里一个很强的观点。

长任务最怕什么？不是模型不会做，而是做着做着窗口满了。

你可以压缩、裁剪、摘要，但这些动作很多都是不可逆的。一旦压错了，后面就会越来越偏。

Managed Agents 的做法是把session当成一个在上下文窗口外部存在的“可追溯状态对象”。Claude 需要什么，不是全塞进当前窗口，而是按需从事件流里重新读取。

也就是说：

• 上下文窗口是“工作台”
• session log 是“仓库”

工作台可以随时整理，仓库不能说丢就丢。

04 它带来的，不只是更稳，还有更快

Anthropic 在文中给了一个很具体的数据：

当他们把 brain 从容器里拆出来之后，p50 的 TTFT 下降了大约 60%，p95 下降超过 90%。

为什么？

因为不是每个 session 一上来都需要起容器、拉代码、装环境。

以前是先把整套环境准备好，模型才能开始推理。

现在变成：

• 先让无状态 brain 开始工作
• 真要动手的时候，再去 provision 对应的 hands

这对很多“先思考、后执行”的任务特别重要。

有些任务前 5 分钟都在读需求、拆计划、决定去哪儿执行。你如果强迫它一开始就把所有容器都准备好，纯属空转。

05 开发者怎么上手？

官方 quickstart 已经给出了很清晰的路径：

1. 创建Agent
1. 创建Environment
1. 创建Session
1. 往Session里发送user.message事件
1. 流式读取 agent 产生的后续事件

像这样：

ant beta:agents create \ --name "Coding Assistant" \ --model claude-sonnet-4-6 \ --system "You are a helpful coding assistant." \ --tool '{type: agent_toolset_20260401}'ant beta:environments create \ --name "quickstart-env" \ --config '{type: cloud, networking: {type: unrestricted}}'

然后创建 session，并往里发事件。

需要注意的是，官方文档当前要求带上 beta header：

anthropic-beta: managed-agents-2026-04-01

如果你用 SDK，这部分会自动处理。

我自己的理解是，Managed Agents 更适合下面这类任务：

• 要连续跑很久的 coding / research / ops 任务
• 需要恢复、重试、追踪完整事件历史
• 要接自定义 MCP、VPC 内资源、外部工具系统
• 你不想自己维护一整套 agent harness

如果你只是做一次性问答，或者短链路工具调用，普通 Messages API 依然更轻。

06 我对这次发布的判断

我觉得 Anthropic 这次最重要的，不是“又开放了一个新 API”。

而是它把一个原本只属于内部 agent 工程团队的经验，变成了平台能力。

说白了，Managed Agents 想解决的不是“怎么让模型多会一步”，而是：

当模型已经越来越会了，你的运行时还能不能别掉队。

这也是为什么他们在文中反复强调：harness 里编码的很多假设，都会随着模型能力提升而过时。

今天你为了防“上下文焦虑”加的机制，明天可能就是负担。
今天你为了方便把凭据塞进容器，明天可能就是最大风险点。

所以他们没有把某一种 harness 写死，而是做了一个更像“meta-harness”的东西：

• 对接口有明确主张
• 对具体内部实现尽量少做假设
• 允许未来换模型、换工具、换 sandbox、换 orchestration 方式

如果你最近正好在折腾 AI Agent，这个产品最值得你学的，不只是 API 用法，而是这套设计思路：

把 prompt 当能力，把 harness 当系统。

前者决定它聪不聪明，后者决定它能不能活着跑完。

如果你最近也在做 Agent 基础设施，欢迎留言聊聊：你现在最头疼的是上下文、权限、恢复，还是多环境执行？

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线科技企业深耕十二载，见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事，早已在效率与薪资上形成代际优势，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包：

✅ 从零到一的 AI 学习路径图
✅ 大模型调优实战手册（附医疗/金融等大厂真实案例）
✅ 百度/阿里专家闭门录播课
✅ 大模型当下最新行业报告
✅ 真实大厂面试真题
✅ 2026 最新岗位需求图谱

所有资料 ⚡️ ，朋友们如果有需要《AI大模型入门+进阶学习资源包》，下方扫码获取~

① 全套AI大模型应用开发视频教程

（包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点）

② 大模型系统化学习路线

作为学习AI大模型技术的新手，方向至关重要。正确的学习路线可以为你节省时间，少走弯路；方向不对，努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划，带你从零基础入门到精通！

③ 大模型学习书籍&文档

学习AI大模型离不开书籍文档，我精选了一系列大模型技术的书籍和学习文档（电子版），它们由领域内的顶尖专家撰写，内容全面、深入、详尽，为你学习大模型提供坚实的理论基础。

④ AI大模型最新行业报告

2025最新行业报告，针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估，以了解哪些行业更适合引入大模型的技术和应用，以及在哪些方面可以发挥大模型的优势。

⑤ 大模型项目实战&配套源码

学以致用，在项目实战中检验和巩固你所学到的知识，同时为你找工作就业和职业发展打下坚实的基础。

⑥ 大模型大厂面试真题

面试不仅是技术的较量，更需要充分的准备。在你已经掌握了大模型技术之后，就需要开始准备面试，我精心整理了一份大模型面试题库，涵盖当前面试中可能遇到的各种技术问题，让你在面试中游刃有余。

以上资料如何领取？

为什么大家都在学大模型？

最近科技巨头英特尔宣布裁员2万人，传统岗位不断缩减，但AI相关技术岗疯狂扩招，有3-5年经验，大厂薪资就能给到50K*20薪！

不出1年，“有AI项目经验”将成为投递简历的门槛。

风口之下，与其像“温水煮青蛙”一样坐等被行业淘汰，不如先人一步，掌握AI大模型原理+应用技术+项目实操经验，“顺风”翻盘！

这些资料真的有用吗？

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理，现任上海殷泊信息科技CEO，其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证，服务航天科工、国家电网等1000+企业，以第一作者在IEEE Transactions发表论文50+篇，获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目，无论你是小白还是有些技术基础的技术人员，这份资料都绝对能帮助你提升薪资待遇，转行大模型岗位。

企业官网建设流程全解析

Agent 的真正难点，不在模型，在“脏活累活”

01 Managed Agents 到底是什么？

02 Anthropic 这次真正拆掉的，是“宠物容器”

03 为什么“脑手分离”这么重要？

1. 出故障时，不用再救容器

2. Harness 挂了，也能从日志里醒过来

3. 凭据不再暴露给 Agent 自己写的代码

4. Session 不等于上下文窗口

04 它带来的，不只是更稳，还有更快

05 开发者怎么上手？

06 我对这次发布的判断

如何学习大模型 AI ？

① 全套AI大模型应用开发视频教程

② 大模型系统化学习路线

③ 大模型学习书籍&文档

④ AI大模型最新行业报告

⑤ 大模型项目实战&配套源码

⑥ 大模型大厂面试真题

以上资料如何领取？

为什么大家都在学大模型？

这些资料真的有用吗？

以上全套大模型资料如何领取？

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

Agent 的真正难点，不在模型，在“脏活累活”

01 Managed Agents 到底是什么？

02 Anthropic 这次真正拆掉的，是“宠物容器”

03 为什么“脑手分离”这么重要？

1. 出故障时，不用再救容器

2. Harness 挂了，也能从日志里醒过来

3. 凭据不再暴露给 Agent 自己写的代码

4. Session 不等于上下文窗口

04 它带来的，不只是更稳，还有更快

05 开发者怎么上手？

06 我对这次发布的判断

如何学习大模型 AI ？

① 全套AI大模型应用开发视频教程

② 大模型系统化学习路线

③ 大模型学习书籍&文档

④ AI大模型最新行业报告

⑤ 大模型项目实战&配套源码

⑥ 大模型大厂面试真题

以上资料如何领取？

为什么大家都在学大模型？

这些资料真的有用吗？

以上全套大模型资料如何领取？

热门文章

文章分类

标签云

相关文章

别让 Obsidian 成了又一个吃灰收藏夹

不止抠图！用U2Net的4.7MB小模型在树莓派上实现实时背景替换（Python+OpenCV部署指南）

markdown浏览器插件终极指南：3分钟快速提升你的Markdown阅读体验

需要专业的网站建设服务？