数据表明,采石场不会影响房价?
这是读《简单统计学》的第 5 -2 篇文章。
趋势一致的数据放在一起,人们总能得出一些无厘头的结论。
比如《想结束单身狗生活,请喝啤酒!?》里面,由于啤酒销量和结婚人口的趋势一致,相关性高,所以能得出婚姻导致喝酒,或者啤酒促进结婚两个相反的结论。
有时人们也会故意把趋势一致的数据放在一起,用有欺骗性的结论作为自己的论据。
比如,采石场不会影响房价。

2005 年,美国一个矿业公司想在南加州的蒂梅丘拉建造一个超级采石场。蒂梅丘拉的居民反对这个计划,因为担心影响房价。
不过,咨询师指出,加州科罗纳市的一个采石场已经存在了几十年了,那里的房价和没有采石场的城市具有几乎相同的增长率。
因此,采石场不会影响房价。

所以你应该欢迎在自己的房子附近建采石场吗?
当然是拒绝啊!
《简单统计学》里面是这样写的:
当任何两样事物随时间增长时,它们之间可能没有任何因果关系,但它们仍然具有统计相关性。
矿场生产和房价也是同样的道理。
两者都随时间增长,但它们之间不一定存在因果关系。
2006 年,一份针对俄亥俄住宅的研究表明,距离采石场 1.6 公里的房价下降了 15%,距离采石场 3.2 公里的房价下降了 9%。
所以,看起来相同的增长率,其实前面还有一个巨大的下跌。

再读一遍这句话:
当任何两样事物随时间增长时,它们之间可能没有任何因果关系,但它们仍然具有统计相关性。
和《想结束单身狗生活,请喝啤酒!?》里面的案例一样,相关性不代表因果性。
说到相关性,还记不记得去年很多茅台啊、茶水啊抑制新冠病毒的新闻?
相比矿场和房价,这样的新闻更可恶。因为这是拿人的生命健康开玩笑。
随着时间的发展,溶液里的病毒逐渐死亡,从数据上看,加进去的东西和病毒死亡确实有相关性,但并不一定有因果性。
打个粗俗的比方,我撒泡尿进去,然后病毒死了,能说明我的尿抑制病毒么?
不能啊。
相关性不代表因果性。
更何况,体外试验和体内试验是完全不同的。
所以不要被相关性欺骗了。
挖掘相关性没错,但我们在分析问题的时候,应该把分析模型建立在因果逻辑上,而不是相关性上。
下次讲一个基于相关性,且有因果逻辑的分析模型:用食盐销量计算人口数量。