业务丨AB实验 – 源码巴士

浅谈AB测试里常见的辛普森悖论
最重要的一点是，要得到科学可信的AB测试试验结果，就必须合理的进行正确的流量分割，保证试验组和对照组里的用户特征是一致的，并且都具有代表性，可以代表总体用户特征。
在这里插入图片描述

AB Test 实验一般有 2 个目的：

流量分配

实验设计时有两个目标：

因此经常需要在流量分配时有所权衡，一般有以下几个情况：

新鲜劲数据陷阱
用户对于产品中的新功能往往会产生好奇, 而这一好奇在数据层面就会反映在点击上.
因此在做AB测试评估时, 需要观测指标到稳定态后, 再做评估.
避免新鲜劲数据陷阱.
人群差异陷阱
由于不同人群在指标上先天存在差异, 因此在分析AB测试结果时, 需要考虑到不同人群的差异.
这也是抽样算法合理性的意义所在. 一个较为科学合理的抽样算法, 能在很大程度上规避掉不同人均的影响差异, 做到基于基准指标的分层随机抽样. 确保基准指标的分布基本一致.