随着《生成式人工智能服务管理暂行办法》《生成式人工智能服务备案管理细则(修订版)》全面落地,大模型备案已成为 AI 企业合规运营的硬性门槛。未备案面向公众提供服务,将面临产品下架、最高 1000 万元罚款及责任人追责等严厉处罚。本文基于 2026 年最新监管要求,系统梳理大模型备案全流程资料清单、核心材料撰写要点与审核避坑指南,助力企业一次性通过备案。
一、先明确:哪些情况必须做 “大模型备案”?
备案核心判定标准:面向境内公众提供服务、具有舆论属性或社会动员能力。
- 必须备案(高 / 中风险)
- 企业自主研发、训练的通用 / 行业大模型,对外提供服务;
- 基于开源模型(LLaMA、Qwen 等)深度微调、架构修改、Prompt 改造后服务;
- 调用第三方备案 API,但做二次开发、功能封装、逻辑改写(非纯转发)。
- 仅需登记(低风险)纯调用第三方已备案大模型 API,无任何二次开发,仅简单接口转发。
- 无需备案 / 登记模型仅企业内部自用、研发测试,不对外提供任何服务。
二、第一大类:主体资质材料(基础必备,缺一不可)
所有材料需加盖企业公章、彩色扫描、在有效期内,信息必须与营业执照完全一致。
- 企业主体证明
- 营业执照副本彩色扫描件(含统一社会信用代码);
- 法定代表人身份证正反面扫描件;
- 企业简介(含主营业务、团队规模、AI 业务布局)。
- 安全责任与人员材料
- 算法安全责任人身份证、工作证明(明确岗位职责、联系方式);
- 数据安全负责人、内容安全负责人任命书及身份证明;
- 安全团队架构图、人员资质证明(技术 / 法务 / 合规)。
- 互联网服务资质
- ICP 备案号截图(涉及网站、小程序、公众号);
- ICP 经营许可证(EDI 证,涉及付费、API 商业化服务);
- 域名证书、服务器托管 / 云服务协议(证明境内部署)。
- 承诺与授权文件
- 《大模型备案承诺书》(承诺信息真实、承担安全主体责任);
- 法人授权委托书(委托经办人办理备案)。
三、第二大类:核心备案表单(官方标准模板)
- 《生成式人工智能服务上线备案表》(核心主表)监管统一模板,需精准填写,信息不一致直接驳回:
- 基础信息:模型名称、版本号、类型(文生文 / 多模态)、参数规模(7B/13B 等);
- 服务信息:功能、应用场景、服务对象、服务形态(网页 / APP/API)、覆盖地域;
- 研制信息:训练框架(TensorFlow/PyTorch)、算力环境(GPU 型号 / 算力规模)、训练周期;
- 安全信息:内容过滤机制、用户投诉渠道、应急响应机制。
- 《落实算法安全主体责任基本情况》说明企业安全管理制度、组织架构、责任分工、风险防控能力。
四、第三大类:技术核心材料(审核重点,最易驳回)
1. 《算法安全自评估报告》(60-100 页,备案核心)
需逐条响应《生成式人工智能服务安全基本要求》,覆盖 6 大核心维度:
- 模型基础信息:名称、版本、架构图、数据流转图、技术原理、能力边界;
- 训练数据安全(审核重中之重)
- 语料来源清单、规模、类型(文本 / 图片 / 音频);
- 合法性证明:开源协议、采购合同、授权书、自采数据知情同意书;
- 脱敏 / 去标识化措施、个人信息保护方案、数据存储周期(≥3 年);
- 境外语料占比(≤30%)及来源合规证明;
- 违法信息筛查记录、不合格语料处理方案。
- 模型安全能力
- 敏感问题拒答率≥95%、非拒答测试拒答率≤5%;
- 内容安全拦截机制(AI 自动过滤 + 人工复核);
- 歧视、暴力、虚假信息、隐私泄露等风险防控措施;
- 未成年人保护、错误信息纠正功能。
- 生成内容管控
- 内容标识机制(显式水印 + 隐式哈希);
- 生成内容可追溯、可鉴别、可删除方案;
- 侵权投诉处理流程、用户权益保障机制。
- 安全测试数据
- 人工抽检语料≥4000 条(合格率≥96%);
- 技术筛查≥10% 语料(合格率≥98%);
- 敏感问题测试≥300 条(拒答率≥95%)。
- 应急与运维
- 安全事件应急预案、处置流程、上报机制;
- 模型更新、迭代、下线管理规范;
- 日志留存、审计记录(≥6 个月)。
2. 训练数据与标注材料
- 《语料标注规则》标注团队介绍、标注流程、安全标注细则、质控标准、标注记录。
- 《训练语料来源清单》明细至数据源名称、授权方、采集时间、使用范围、合规校验报告。
- 知识产权证明开源语料许可文件、商业语料采购合同、自有数据版权声明。
3. 内容安全防控材料
- 拦截关键词列表总规模≥10000 条(北京要求 20 万 - 50 万条),覆盖 17 类安全风险,附动态更新机制。
- 评估测试题集
- 生成内容测试题≥2000 条(覆盖日常 / 专业 / 边缘场景);
- 拒答测试题≥500 条(敏感问题、诱导性问题);
- 测试结果记录、模型响应分析报告。
五、第四大类:产品与服务合规材料
- 《模型服务协议》(用户协议 + 隐私政策)
- 服务范围、禁止行为、免责声明(用户指令导致侵权责任界定);
- 数据收集 / 使用 / 存储 / 删除规则、用户知情权 / 选择权 / 删除权;
- 未成年人保护、内容合规提示、投诉渠道。
- 产品运行说明
- 服务形态、用户交互流程、内容展示规范;
- 内容标识展示位置、用户告知机制;
- 日志留存方案、数据审计流程。
六、第五大类:管理制度与组织材料
- 算法安全管理制度
- 数据安全与个人信息保护制度
- 违法有害信息处置机制
- 内容安全审核规范、人工复核流程
- 应急响应预案、安全事件上报制度
- 人员培训、安全考核制度
七、备案流程与时间周期(2026 最新)
- 前期准备(1-2 周):判定备案需求、完成内部合规自查;
- 材料撰写(2-3 个月):核心材料撰写、测试、打磨;
- 省级初审(4-6 周):属地网信办材料审核 + 技术测试;
- 中央终审(4-8 周):多部委联审、专家评审(高风险模型);
- 公示与上线:通过后统一公示,企业悬挂备案号方可正式上线。
八、避坑核心要点(一次性通关关键)
- 信息一致性:所有材料中模型名称、主体信息、版本号必须完全统一;
- 数据合规:境外语料严格≤30%,无授权数据坚决剔除,留存完整授权链;
- 能力边界:不夸大模型能力,明确不适用场景,降低审核风险;
- 测试达标:敏感问题拒答率、内容合格率必须达标,附完整测试记录;
- 材料详实:拒绝模板化,所有制度、措施需匹配企业实际运营。
结语
大模型备案不是 “形式合规”,而是全生命周期安全能力的综合核验。企业需提前规划、系统筹备,确保资料真实、完整、合规。建议组建技术 + 法务 + 合规专项团队,或委托专业机构协助,避免因材料瑕疵导致反复驳回,延误产品上线周期。