Local EPUB Text
COLUMN 8 因果推理的发展史
经济学及统计学领域的因果推理
因果推理在经济学领域的历史其实并不长。20世纪40年代,挪威奥斯陆大学的经济学者特里夫·哈维默(Trygve Magnus Haavelmo)在论文中使用了与反事实概念相类似的表述,但这一表述从严格意义上来说还算不上对反事实的准确定义。
进入20世纪90年代后,出现了一些较大变化。当时哈佛大学经济学院的著名计量经济学家吉多·因本斯(Guido Imbens)、麻省理工学院的劳动经济学家安格瑞斯特开始和唐纳德·鲁宾(参考正文第14页)合作,将“鲁宾因果模型”引入经济学。③
哈佛大学和麻省理工学院都位于美国马萨诸塞州剑桥市,地缘上的接近或许也是促成他们合作的一个原因。鲁宾和因本斯合著的《统计学、社会科学及生物医学领域中的因果推理导论》(Causal Inference for Statistics and Biomedical Sciences: An Introduction )以他们多年来在哈佛大学经济学院的课堂讲义为基础撰写而成,2015年出版后旋即被誉为“因果推理”领域最经典的教科书。
因果推理在经济学领域的历史不长是有原因的。因为流行病学和生物统计学可以进行“临床试验”等实验,但是经济学等社会科学领域则很难组织实验。以人类为对象的实验除了资金和伦理方面的问题之外,大多还会伴随政治层面的难题。这些因素使得因果推理一直无法在经济学领域得到普及。
然而,进入21世纪以后,经济学领域出现了一些新动向。芝加哥大学的实验经济学家约翰·A.李斯特(John A. List)以及由发展经济学家们组成的麻省理工学院扶贫实验室(J-PAL)的学者们克服重重障碍,开始进行大规模社会实验。
扶贫实验室堪称“实施随机对照试验”的专业组织,所有研究均采用随机对照试验。他们以“把易受政治风向左右的政策变为有理有据的政策”为目标,成功提高了随机对照试验的地位,使其成为“政策评估的理想方式”。
在经济学中,根据因果推理来评估政策效果的研究领域叫作“政策评估”,近年来该领域正在快速形成体系。
流行病学领域的因果推理
除经济学和统计学之外,因果推理的思维方式在其他学科中也得到了发展。其中之一便是流行病学。如果说“医学”是以个体为对象,研究其患病原因和治疗方法,那么“流行病学”就是要研究集体的患病原因和预防方法。医生、护士等拥有医学背景知识的读者或许对流行病学领域的因果推理更为熟悉。
20世纪90年代中期,犹太裔的美国计算机科学家朱迪亚·珀尔(Judea Pearl)开发了运用有向无环图(DAG)来证明因果关系的方法。后来哈佛大学的詹姆斯·罗宾斯(James Robins)和米格尔·埃尔南(Miguel Hernán)、加州大学洛杉矶分校的桑德·格林兰(Sander Greenland)等人将有向无环图推广到医学及流行病学领域。最终,医学院和公共卫生研究院接纳了这种方法论并将其编入教材。
有向无环图的最大特点是用箭头示意图来体现因果关系。本书中多次出现的用箭头表达因果关系或相关关系的示意图也可算作有向无环图。
由于混杂因素(参考正文第7页)是“同时影响原因和结果的第三变量”,如果某一变量的箭头可以同时指向原因和结果,那么这个第三变量便可以视为混杂因素。(见图表8-3)如果确定存在混杂因素,就必须用匹配法或多元回归分析排除其影响,否则无法正确评估因果关系。
图表8-3 必须排除混杂因素的影响
与此相对,如果箭头的方向相反,是从原因指向第三变量的话,则可以判定该变量不是混杂因素(该变量位于因果关系通道的中间,故名“中间变量”。见图表8-4)。如果用多元回归分析等方法处理中间变量,则会低估原因原本具有的影响。
图表8-4 不能排除中间变量的影响
① “保持固定不变”也可以叫作“校正”“控制”。
② 有研究显示,饮酒量处于中等程度及以下时,饮酒与肺癌之间没有关系,但就大量饮酒的人来说,饮酒与肺癌之间可能存在因果关系。也有研究使用日本人的数据,在论文中指出在吸烟者中发现饮酒与肺癌之间存在因果关系,但从整体上来看,这一问题尚未得出结论。
③ 鲁宾因果模型认为,所有人都有两种“潜在结果”,一种是受到干预后的潜在结果,另一种是未受到干预时的潜在结果。但任何人都只能观测到其中一种结果。实际中受到干预的人无法观测未受到干预时的潜在结果。而实际未受干预的人也无法观测到受到干预时的潜在结果。也就是说,鲁宾认为因果推理的根本问题就在于任何人都只能观测到一种潜在结果。