数据脱敏(Data Masking)是一种通过特定规则对敏感数据进行变形、替换或屏蔽的技术,目的是在保留数据可用性的同时,降低数据泄露风险,满足合规要求(如 GDPR、个人信息保护法)。脱敏后的数据可用于开发、测试、分析、培训等非生产环境,或在生产环境对外展示时保护隐私。
一、核心原则
不可逆性:脱敏后的数据不能轻易还原为原始值(尤其是静态脱敏)。
保留业务特征:如保持数据长度、类型、格式、统计分布等,以支持功能测试和数据分析。
一致性:同一原始值在不同记录中应脱敏为相同结果(如关联字段一致性)。
可重复性:多次脱敏同一数据集应产生相同结果(确定性算法)。
可配置性:根据数据类别、角色权限采用不同脱敏策略。
二、常见数据脱敏方法
| 方法 | 描述 | 示例 | 适用场景 |
|---|---|---|---|
| 替换 | 用固定值或随机值替换敏感数据 | 手机号 → 138****0000 | 通用,保留长度和格式 |
| 加密 | 使用密钥加密,可逆(通常视为加密而非脱敏) | 身份证号 → AES 加密 | 需要还原的生产环境 |
| 哈希 | 使用单向散列函数(如 SHA‑256) | 邮箱 |