你的AB test成功了吗?

AB Test的基本逻辑(详见笔记

  1. 两个组别:控制组,实验组
  2. 两个假设:原假设(新功能没有效果,没有差异),备择假设
  3. 选择显著性水平
  4. 选择检验功效,计算样本数量
  5. 进行T-test,计算检验统计量与检验p-value
  6. 将检验p-value与显著性水平做比较,给出判断

判断AB test合理与否的几个关键

  1. 足够的数据
  2. 控制组和实验组规模相当
  3. 实验进行足够的时长,以抓住一段周期(一周)的规律,最少一周,两周为宜
  4. 用可视化的方式检验控制组/测试组的变化趋势,查看是否有猛烈变化
  5. 控制组和实验组中的用户构成一致【重中之重】:例如,在控制组中有10%英国用户,在实验组中也应该有大致相当的比例

检验控制组/实验组中用户构成的方法

  • 普通方法:针对不同分类画图比较
  • 高级方法:建立树模型预测用户所属组别,查看tree plot。如果存在特征能将两组用户明显地区分开来,则说明该类别的分布出现了问题。

AB test核心代码

# perform a t-test on control group and test group
from scipy import stats
t_test = stats.ttest_ind(df[df['test']==1]['conversion'],
                         df[df['test']==0]['conversion'],
                         equal_var = False)
# check t statisitc
t_test.statistic

# check p value
t_test.pvalue

完整项目


© 2020. All rights reserved.