入门大模型工程师第八课----让Agent加一道自检闭环-酒店常州论坛

前言

你已经看到 Agent 能拆任务、分头查资料、汇总成一份报告。可只要任务稍微长一点，另一个问题就会冒出来：报告写得很顺，但里面有没有把没完成的事写成完成？有没有遗漏阻塞事项？有没有把不能对外发送的信息写进去？

这类问题不一定靠一句“认真核对一下”就能解决。你需要让 Agent 写完以后，还能拿着依据回头检查一遍。

本课继续用 QoderWork 这类桌面 Agent 演示文件夹读取和任务执行。换成其他支持读取文件夹或上传多个文件的 Agent 时，入口名字可能不同，但判断逻辑相同。

先从一份需要核实的日报初稿开始。

课程目标

学完这节课后，你将能够：

写出执行规则，让 Agent 在执行任务时区分已完成、待确认、阻塞和不能对外发送的信息
在生成草稿时同步留下过程记录，写清事项来源、原始记录状态和处理方式
把复核中发现的问题补进执行规则或自检清单，减少下次同类错误

1 日报初稿容易出什么问题

假设你每天结束工作前都会发一份日报。你把今天的任务记录、客户名单修改记录、会议纪要、报销进度交给 Agent，让它整理成日报。

它给出的初稿可能长这样：

## 2026-05-15 日报 ### 已完成 1. 完成客户续费名单整理，已按客户等级标注优先级。 2. 补充“客户回访话术”说明，已更新到团队共享文档。 3. 完成下周客户拜访排期，已和销售同事确认时间。 4. 费用报销材料已提交，后续等待财务打款。 ### 明日计划 - 跟进重点客户续费确认。 - 整理本周客户反馈。 ### 备注 - 已确认客户采购预算约某预算金额。

这份日报看起来顺畅，但发布前需要核实。对照原始记录，会发现几类问题：

日报里的说法	原始记录里的情况	问题
已和销售同事确认下周客户拜访时间	会议纪要写的是“还有两位客户待回复”	把待确认写成已完成
费用报销材料已提交	报销记录写的是“缺少发票，暂未提交”	把阻塞写成已完成
没有风险/阻塞栏目	任务记录里明确有阻塞项	遗漏阻塞事项

这不是格式问题。它真正错在状态和证据：待回复的事被写成确认，缺材料的事被写成提交。还有一类问题是发送范围：备注里的客户预算不该进入日报正文。

2 告诉 Agent 什么算合格

上面这些问题——状态写错、证据缺失、不该发的信息混进正文——可以通过一段执行规则来减少。把“什么算合格”写清楚，让 Agent 整理日报时全程遵守：

执行规则： - 已完成事项必须有证据。 - 进行中、阻塞、待确认不能写成已完成。 - 不能遗漏阻塞事项。 - 私密备注不能进入日报正文、问题清单、过程记录、自检结果等任何输出。

执行规则能减少错误，但不能保证输出已经合格。它不是只在开始前生效，而是 Agent 整理材料和生成日报时都要遵守的边界。

规则尽量写成能检查的句子。“内容准确”太宽，“已完成事项必须有证据”就更容易核对。

3 生成草稿时同步留下过程记录

为了让后面能检查，不要只让 Agent 给出日报正文，还要让它在旁边列一份过程记录。过程记录不用给别人看，只供你或检查 Agent 判断每个关键内容从哪里来、处于什么状态、能不能写进正文。即使过程记录只给自己看，也不要复述私密备注的具体内容。

这不是固定模板。你也可以换成别的表格列，关键是说清楚：写了什么、依据在哪里、原始记录里显示的状态是什么、这条内容应该怎么处理。比如保留、改写、移到待确认或风险/阻塞栏目，或者删除敏感内容。为了检查方便，先用下面这个表格：

事项｜原始记录状态｜来源文件｜原文线索｜处理方式

例如：

事项	原始记录状态	来源文件	原文线索	处理方式
客户续费名单整理	已完成	customer_list_update.md + tasks.md	已按客户等级标注优先级	保留在“已完成”栏目
下周客户拜访排期	待确认	meeting_notes.md + tasks.md	还有两位客户待回复	改到“待确认”栏目，不能写成已完成
费用报销材料	阻塞	reimbursement_notes.md + tasks.md	缺少发票，暂未提交	改到“风险/阻塞”栏目，并说明当前卡在哪里

执行规则用来说明 Agent 必须遵守什么，过程记录用来留下来源、状态和处理方式。没有过程记录，后面检查时就只能凭感觉判断“像不像对”。

4 换个对话，专门检查初稿

可以新开一个对话，把初稿、过程记录和必要的原始文件交给它，让它只做检查，不负责写稿。这样职责更单一。

很多检查项可以从执行规则改写而来。执行规则写“已完成事项必须有证据”，检查时就问“每条已完成是否都有证据？”自检清单可以按材料类型调整，这里先用下面这组问题：

自检清单： 1. 每条“已完成”是否有证据？ 2. 是否有未完成事项被写成已完成？ 3. 是否遗漏阻塞事项？ 4. 是否把计划、讨论或承诺误写成结果？ 5. 是否泄露或复述不能对外发送的信息？

通常你会看到它把问题列出来：

抓到的问题	初稿里的内容	依据
待确认写成已完成	已和销售同事确认下周客户拜访时间	会议纪要写“还有两位客户待回复”
阻塞写成已完成	费用报销材料已提交	报销记录写“缺少发票，暂未提交”
遗漏阻塞事项	初稿没有风险/阻塞栏目	任务记录里有阻塞项
敏感信息进入输出	备注里出现客户采购预算	私密备注写明不得进入日报

自检清单的作用不是“再读一遍”。只说“请认真检查一下”，通常容易得到泛泛的确认；说“按过程记录逐条检查”，更容易让它指出哪个关键内容没有证据、哪条状态写错了。

5把检查前后要做的事串起来

前面每一步单独看都很小，连起来才是一套固定流程：写之前有规则，写的时候留依据，写完后按清单检查，发现问题后修订输出，再整理下次能用的检查项。

这套流程可以这样展开：

什么时候	要做什么	日报里的例子
写之前	写执行规则	已完成事项必须有证据
生成草稿时	留过程记录	下周客户拜访排期来自会议纪要，仍有客户待回复
写完后	按自检清单检查	有没有把待确认写成已完成
发现问题后	修订输出	把排期移到“待确认”，把报销移到“风险/阻塞”
修订后	补规则或检查项	增加“待审批不能写成已完成或已确认”

这类套在模型外面的约束与引导机制，业界通常叫Harness Engineering（驾驭工程）。Harness 原意是马具，用来约束和引导马的力量；放到 Agent 里，Harness 就是约束规则、检查反馈和纠偏机制的组合，套在模型外面，让它跑得快但不跑偏。

执行规则在行动前就告诉 Agent 哪些状态不能写错、哪些内容不能对外发送；自检清单在行动后检查输出有没有偏离这些规则。业界有时把行动前的引导叫 Guides，把行动后的检查叫 Sensors。

每次发现问题后补规则或检查项，不是为了保证以后一定不出错，而是让下次更容易提前发现同类问题。

6 反复验证后，保存成下次能用的模板

刚才这套流程还是你手动触发的：你把材料交给 Agent，先生成日报，再换个对话检查，最后修订并补检查项。重复做几次之后，如果同一类事每天、每周都会发生，就可以把固定路线写下来：

读取指定资料 → 生成草稿并留过程记录 → 按自检清单检查 → 修订并调整检查项 → 等人确认

先不要急着自动发送或定时运行。下一步仍然建议手动触发：确认它能按固定路线读取材料、生成草稿、留下过程记录、按自检清单检查并修订。反复用几次确认这几步能稳定跑完后，再决定哪些低风险步骤可以自动，哪些动作必须等人确认。

可以自动化的通常是整理、摘要、草稿和待确认清单；发送、删除、移动真实业务文件、付款、外发含敏感信息的内容，都要停下来等人确认。

这套流程可以先保存成一份提示词模板，下次直接复制使用。模板不是固定格式，关键是把每次都要重复交代的内容放在一起；下次使用时，只需要改资料位置、日期和具体任务。模板里可以包含这些内容：

执行规则：哪些状态不能写错，哪些信息不能对外发送；
过程记录：每条内容要写清来源、原始状态和处理方式；
自检清单：每次写完后要检查哪些问题；
常见问题：以前出过哪些错，下次怎么查；
需要你确认的动作：哪些内容不能自动发送或自动处理。

如果这份模板反复使用、内容也比较稳定，再考虑做成 Skill 或定时任务。同一类问题反复出现时，不要只改这一次输出，先把对应检查项补进提示词模板；如果已经做成 Skill，也同步补进 Skill。

企业官网建设流程全解析

前言

课程目标

1 日报初稿容易出什么问题

2 告诉 Agent 什么算合格

3 生成草稿时同步留下过程记录

4 换个对话，专门检查初稿

5把检查前后要做的事串起来

6 反复验证后，保存成下次能用的模板

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

前言

课程目标

1 日报初稿容易出什么问题

2 告诉 Agent 什么算合格

3 生成草稿时同步留下过程记录

4 换个对话，专门检查初稿

5把检查前后要做的事串起来

6 反复验证后，保存成下次能用的模板

热门文章

文章分类

标签云

相关文章

从0.04%到即插即用：RedSkill的种草困境与ibbot手机青春版的Token经济反击战

终极指南：用StreamFX插件让OBS直播画面瞬间专业化

终极抖音评论采集神器：三步获取完整用户反馈数据

需要专业的网站建设服务？