MahaHate-BERT社区贡献指南:如何参与项目开发与改进
2026/5/30 15:46:56
—关注作者,送A/B实验实战工具包
做 AB 实验时,新手看“均值”,高手看“趋势”。
很多实验会出现这种诡异的现象:
这两个剧本背后的操盘手,就是时间维度上的两大干扰因子:新奇效应 (Novelty Effect)与改变厌恶 (Change Aversion)。
如果不理解这两个概念,你的实验结论在“第 1 天”和“第 7 天”可能是截然相反的。
定义:
用户对改动产生互动,仅仅是因为它**“长得不一样”或“很新鲜”**,而不是因为改动本身带来了价值。
痛点:
它会导致第一类错误 (Type I Error),即假阳性。
你以为你的新 UI 设计得很棒,其实用户只是因为“原本灰色的按钮变红了”,出于好奇点了一下。这种点击是不可持续的。
典型场景:
数据特征:
这里回答一个常见问题:学习效应是不是就是改变厌恶?
答案:不是,但它们通常相伴而生。
定义:
老用户已经形成了肌肉记忆。当你改变布局时,增加了他们的认知负荷,导致效率下降或产生负面情绪。
例子:
你把“付款”按钮从右下角移到了左下角。
定义:
用户从“不习惯”到“习惯”,从“不会用”到“熟练使用”的时间过程。
数据特征:
当实验曲线波动剧烈时,如何判断是“策略真的烂”还是“改变厌恶”?
最硬核的鉴别方法是:将用户拆分为“新用户”和“老用户”看数据。
| 现象 | 老用户表现 | 新用户表现 | 诊断结论 | 建议 |
|---|---|---|---|---|
| 场景 A | 暴涨 🔥 | 平平 😐 | 新奇效应 | 别急着推全,延长观察期,看数据是否回落。 |
| 场景 B | 暴跌 📉 | 上涨 📈 | 改变厌恶 | 顶住压力,这是好策略!给老用户一点学习时间。 |
| 场景 C | 上涨 📈 | 上涨 📈 | 真实收益 | 稳了,全量上线。 |
不要只看累计数据的 P 值。必须画出Day 1到Day N的指标变化趋势图。
这是最笨但最有效的方法。
对于可能引发强烈“改变厌恶”的功能(如改版):
如果这篇文章帮你理清了思路,不妨点个关注,我会持续分享 AB 实验干货文章。