因果推断决定着AI的未来？！【文末6.1礼物】

2022-05-30 16:41 作者:深度之眼官方账号 0人读过 | 我要投稿

作者：埼玉老师编辑：学姐

人人都承认,任何事物只要存在,就有它所以存在的原因 ⸺ 休谟

图灵奖获得者珀尔是当下AI领域最尖锐的批评者之一,珀尔认为当下的AI并未真正产生智能,因为它们不曾理解因果关系。

其实在历史的长河中,从人类从记事开始,就在不断的探讨和研究因果,尝试对因果进行定义和研究。

在古希腊时期,亚里士多德提出“四因说”,即目的因、物质因、形式因和动力因。其中，目的因可以理解为一种解释,他相信自然界中的每一件事物都是有其[目的]。

到了17世纪,牛顿建立了经典力学体系,后面逐渐形成了机械决定论的因果观⸺即整个世界的时空都看成是一系列确定性因果事件的链条。基于此因果观,法国物理学家拉普拉斯的一句话最为著名【只要给我足够的初始条件,宇宙所有粒子的初始位置和速度,我就可以预测一切】,此时期的因果观是绝对性的。

同时期的休谟,虽然对因果关系的存在性保持怀疑态度,但他先后在《人性论》和《人类理智研究》中尝试给出了因果关系的两个定义。一个定义是【两个类似的对象在时间上先行和空间上的邻近的关系】,另一个定义是【假如没有前一个对象, 那么后一个对象就不可能存在】。第一个定义将因果关系表达为观念间的联结,第二个则涉及到了反事实推理的必要因,这是后面潜在结果框架的核心。

时间来到20世纪, 1923年,内曼在他的博士毕业论文中,第一次提出了潜在结果框架 ,利用该框架来研究因果关系,并创新性的将因果关系和统计学结合了起来, 此时的因果观不再是绝对性的,而是概率性的。随后,鲁宾则在内曼的基础上,进一步的将潜在结果框架运用在了因果的观察性研究中。

到了20世纪90年代,计算机科学家珀尔开始倡导因果信息革命,提出了因果图框架以解决因果推断中的反事实推断和因果关系挖掘的问题,并证明了该框架在一定条件下和潜在结果框架的等价性。随着时间的推移,人类正在逐步的将因果关系的定义和研究从形而上的概念变得数学化和具象化。

到了21世纪的今天,在计算机、大数据以及算法的加持下,利用数据研究因果已经变得越来越常见。直至今天,国外的谷歌,苹果、脸书等科技公司,国内的阿里,腾讯,百度等互联网企业每时每刻都在利用数据研究着因果——AB 实验, Uplift 模型都是因果理论衍生而来。

接下来,我们再看两个经典的小故事,以说明通过数据探查因果关系的困难性和复杂性:

幸存者偏差
辛普森悖论

幸存者偏差

1941年,第二次世界大战中,美国哥伦比亚大学统计学沃德教授(Abraham Wald)应军方要求,利用其在统计方面的专业知识来提供关于《飞机应该如何加强防护,才能降低被炮火击落的几率》的相关建议。

沃德教授针对联军的轰炸机遭受攻击后返回营地的轰炸机数据,进行研究后发现:机翼是最容易被击中的位置,机尾则是最少被击中的位置。

军方指挥官认为[应该加强机翼的防护,因为这是最容易被击中的位置]。然而沃德教授却有相反的结论,他认为[应该加强机尾的防护]。沃德教授的理由是统计的样本中,只涵盖了平安返回的轰炸机,并非是机尾不易被击中,而是因为机尾被击中的飞机早已无法返航。

辛普森悖论

辛普森悖论是英国统计学家辛普森于 1951 年提出的悖论,即在某个条件下的两组数据,在分别讨论时都会满足某种性质,可是一旦合并起来进行考虑,却可能导致相反的结论。下面我们以一个经典的医学数据为例:

在这个数据中,我们有A , B两种疗法,如果将样本分为轻症状和重症状,通过数据会发现 A 疗法的治愈率都是高于B疗法的。但看总计的时候,会惊奇的发现A疗法的治愈率反而不如B疗法,于是出现了悖论。

以上两个小故事告诉我们,直接通过数据来推断因果是困难且复杂的。我们不能直接简单的利用相关性的结论作为因果的结论。

最后我们以珀尔在《The book of Why》中提到的因果关系之梯来结束本文。珀尔认为,作为一个智能体,如果要学习因果关系至少需要三种不同层级的认知能力:

第一层级-观察能力

第二层级-行动能力

第三层级-想象能力

这三种不同层级的难度是逐级递增的。

观察能力是指发现环境规律的能力。

行动能力是指预测对环境改变后的结果。

想象能力是指类似于人类的想象和反思,这是产生智慧的至关重要的一种能力。

珀尔将这三种认知能力对应三种不同层级的因果问题。它们分别是:

第一层级-关联问题:如果观察到因素X,因素Y会怎么样?

第二层级-干预问题:如果改变了因素X,因素Y会怎么样?

第三层级-反事实问题:假如因素X没有发生,会如何?

例如在一个房间中有温度计,通过观察到温度计的示数 X 我们能估计房间内的真实温度 Y,这是第一层级的关联问题。第二层级的干预问题则是要研究如果人工故意去改变了温度计的示数 X , Y 会怎么样。

这三个层级的因果问题组成了因果关系之梯。目前大部分的 AI 算法都只停留在第一层级的问题。

也许,因果关系之梯真的是通往强人工智能的关键一步。

点击查看：【5月28日直播回放】因果推断在互联网中的应用

👇儿童节礼物准备好了👇

标签：

因果推断决定着AI的未来？！【文末6.1礼物】

幸存者偏差

辛普森悖论

👇儿童节礼物准备好了👇