大模型（LLM）场景：红队测试（Red Teaming）-酒店常州论坛

按“大模型（LLM）场景”来把 **红队测试（Red Teaming）**讲清楚：它是什么、为什么做、测什么、怎么做、产出什么、常见坑与最佳实践。

红队测试原本来自安全领域：站在“对手/攻击者”视角，主动寻找系统在真实对抗环境下的薄弱点。

放到大模型里，红队测试指的是：用系统化、对抗性的方式去发现模型与其周边应用（RAG、工具调用、Agent、API、权限、日志、前端等）在安全、合规、隐私、可靠性方面的可被利用漏洞，并推动修复与复测。

它和“普通评测（eval）”的区别：

大模型系统的风险不只在“模型会不会答错”，而在“模型会不会被诱导做不该做的事”。原因包括：

企业官网建设流程全解析