[2020.11.23]小哲谈谈伯克森悖论
像这种小众的统计学悖论,估计很多人看到名字都比较陌生,这个概念是我从一个付费课程中了解到的。在写这篇文章之前,我特地去百度收集相关资料,结果发现百度百科都没有收录此词。在提交百度词条的过程中,查询了很多英文资料,结果能获得到的信息也不多。所以我猜测伯克森(Berkson)应该是个人名吧,就像是“芝诺悖论”是古希腊数学家芝诺(Zeno of Elea)提出的一样。
无所谓吧,主要还是通过思考来获得启发,所以切入正题先,“伯克森悖论”(Berkson's ?paradox)比较简单,它就是指两个本来无关的变量之间体现出貌似强烈的相关关系。最近网络上常见的例子就是说颜值高的小鲜肉演技差。
举个更加通俗易懂的抛硬币例子:分别抛掷甲乙两枚硬币,甲乙哪面朝上原本属于两个独立事件。但如果甲已经是正面朝上了,抛掷乙必然大概率是反面朝上,那就是产生了“伯克森悖论”。生活中我们在分析“双色球”走势的时候,此悖论体现得淋漓尽致。
“伯克森悖论”和之前谈过的“幸存者偏差”都属于“选择偏差”,能导致分析出错的根本原因都是统计的数据不够全面。它们两者在表达上的侧重点有所不同,但是归根结底并没有本质的差别。
“幸存者偏差”说的是因为我看到的这些个体都具有这一个特征,我就认为所有相关的个体都具有这一个特征,或者具有这样的特征才能成为相关的个体。而“伯克森悖论”则更强调两个特征之间的关系。颜值高和演技差,是在一群人中被平等选择的两个特征,它们之间本来可能根本没有关系,仅仅是因为选择而有了关系。
那么得到什么启发呢?这里借用万维钢在专栏文章里的总结:生活中有很多这样的民间智慧,比如什么“寒门出贵子”,什么“为富不仁”,什么“仗义每从屠狗辈,负心多是读书人”,什么“杀人放火金腰带,修桥铺路无尸骸”,都十分可疑。平庸的寒门子弟、遵纪守法的富人、没有英雄壮举的屠狗辈、忠诚的读书人和安享晚年的好心人,他们的新闻阈值太低,他们的事迹没有四海传扬。你必须把这些人都统计上,才能得出正确的结论!