辛普森悖论

经典案例




  • 通过性别研究大学录取率
  • 从分组角度看,男生录取率高;从整体看,女生录取率高 -> 仿佛得到两个相悖的结论

产生问题的原因

  • 忽视了潜在变量:专业
  • 分组中的分布发生了改变

应对策略

  • 全面考虑变量关系
  • 正确看待相对数据/绝对数据->在分布发生变化的情况下相对数据不可靠
  • 使用权重来纠正分布的差异

© 2020. All rights reserved.