因果推断书籍推荐
1、因果推断是什么?
因果和相关的区别:他们两个不一样。
因果关系:当一个事件的出现导致、产生或决定了另一个事件的出现,这两个事件之间的关系就被称为因果关系。例如,外面正在下雨,不带雨具出门会被淋湿衣服。下雨和淋湿衣服之间就是因果关系, 下雨是原因,淋湿衣服是结果。
相关关系:客观现象存在的一种非确定的相互依存关系。即自变量的每一个取值,因变量由于受随机因素影响,与其所对应的数值是非确定性的。相关分析中的自变量和因变量没有严格的区别,可以互换。相关关系不等同于因果关系。因果关系必定是相关关系,而相关关系不一定是因果关系。
正确的因果关系可以发现事物本质现象,从而更好的挖掘事物背后的原因,做出更加准确的决策。因此相关是做预测,因果是做决策。如果没有因果容易造成辛普森悖论(比如整个数据集来看锻炼增加胆固醇的风险,但是事实是这样吗?)。
例如:路面潮湿和带伞是具有相关关系的,但是不具有因果关系。
那之间为会有相关关系咧?大家可以自己想一想。
2、因果推断框架
因果推断主要有两大框架领域:分别是
2.1 Rubin虚拟事实模型
通过寻找合适的对照组,进行试验,从而探究某个实验变量是否是结果变量的原因。
2.2 Pearl因果图模型
模型由有向图和观测数据构成,通过一些算法或者方法去推断变量之间是否存在因果关系进行连接,从而探究变量之间的因果关系。
3、因果书籍推荐
Rubin虚拟事实模型
what if causal (rubin)
Pearl因果图模型
大数据中的因果发现(蔡瑞初)
Causal Inference in Statistics A Primer (Judea)
4、一些感想
我自己感觉更会倾向于因果图模型,因为针对实验、或者潜在因果无法做实验,比如吸烟对孕妇影响、酗酒对寿命影响等等。但是存在即真理,每个人看待的事物的思维方式不一样,大家可以根据自己喜好去阅读书籍。
接下来作为统计学,模拟实验必不可少,关于因果推断的软件代码,我也会抽时间给大家介绍一下的。