学习进度

0%

阅读时长

未满 1 分钟

最近阅读:未开始阅读

核心概念

待提炼

章节学习

  • 1

    前 言

    在本书的开篇,我先请各位读者回答以下几个问题。 定期接受代谢综合征体检就能长寿吗? 看电视会导致孩子学习能力下降吗? 上偏差值① 高的大学收入就会更高吗? 想必很多人的回答都是肯定的。 不过,经济学的权威研究已经推翻了上述全部说法。 很多人之所以会做出肯定回答,是因为他们混淆了“因果关系”和“相关关系”。建议那些不假思索做出肯定回答的人务必读一读本书。他们读

    待学习
    开始阅读
  • 2

    何谓“因果关系”和“相关关系”?

    让我们再来看看因果关系和相关关系的概念。 如果两个事件中,前一个事件是后一个事件的原因,后一个事件是前一个事件的结果,则两个事件之间存在“因果关系”;如果一个事件变化后,另一个事件也随之发生变化,但二者不属于原因和结果的关系,则称它们之间存在“相关关系”① 。(见图表1-1)存在相关关系的两个事件之间虽然有关联,但不属于因果关系。 图表1-1 因果关系与相关

    待学习
    开始阅读
  • 3

    判断因果关系的三个要点

    两个变量的关系是否真的是因果关系?解答这个问题所需的思维方法便是“因果推理”。 判断因果关系的三个要点 判断两个变量属于因果关系还是相关关系时,可以通过以下三个问题进行质疑。 ①是否“纯属巧合”? ②是否存在“第三变量”? ③是否存在“逆向因果关系”? ①是否“纯属巧合”? 如果有人提出“温室效应的加剧导致海盗数量下降”,大家肯定觉得荒唐,但如图表1-2所示

    待学习
    开始阅读
  • 4

    证明因果关系需要“反事实”

    如果两个变量之间存在因果关系,当原因再次出现时,相同的结果也会出现,而不存在“纯属巧合”“混杂因素”或“逆向因果关系”。另一方面,如果两个变量的关系只是相关关系,那么就会存在“纯属巧合”“混杂因素”或“逆向因果关系”中的某一种情况。在相关关系的情况下,即使原因再次发生,也几乎不会得到相同的结果。 证明因果关系需要“反事实” 那么,应该如何证明不存在上述三种情

    待学习
    开始阅读
  • 5

    没有时光机就制造不出反事实吗?

    要证明因果关系的存在,必须对“事实”中原因发生后的结果与“反事实”中原因未曾发生时的结果进行对比。 没有时光机就制造不出反事实吗? “反事实”是因果推理中最为重要的概念,下面让我们举例详细介绍。 假设你在一家经营全国连锁珠宝店的企业担任公关部部长,正在考虑通过投放广告来提高销售额。所幸聘请当红小生制作的报纸广告十分具有吸引力,投放时期也定在12月上旬,刚好配

    待学习
    开始阅读
  • 6

    用“最贴切的值”替换反事实

    最早创建因果推理体系的哈佛大学统计学家唐纳德·鲁宾把这个问题称为“因果推理中的根本问题”。然而,要证明因果关系,反事实是必经之路。 用“最贴切的值”替换反事实 其实,克服“因果推理中的根本问题”,制造反事实,才正是以因果推理为基础的各种方法的根本所在。为此,经济学家会想方设法,用最贴切的值来替换无法观测到的“反事实的结果”。 让我们再回到珠宝店的事例。假设你

    待学习
    开始阅读
  • 7

    只有“可比较”的组才能替换

    这样一来,广告对整个企业的因果效应就可以用有广告组的平均销售额(1 500万日元)减去无广告组的平均销售额(1 000万日元)求得,即500万日元(1 500万日元-1 000万日元)。 只有“可比较”的组才能替换 其实,只要满足一个条件,上述思路便可以成立。这个条件就是:有广告组和无广告组必须是“可比较”的。 假设有广告组位于大城市,当地居民收入很高。而无

    待学习
    开始阅读
  • 8

    想象不出正确的反事实就会被无稽之谈蒙蔽吗?

    然而,现实中我们很难找到这样的事例。正因为如此,经济学者们要运用各种方法,尝试将两个不相似的组转化为“可比较”的组。这些方法将在第2章之后详述。 想象不出正确的反事实就会被无稽之谈蒙蔽吗? 我想在这里反复强调的是,要明确是否存在因果关系,必须对比事实的结果和反事实的结果。不过遗憾的是,很多人尚未意识到这一点。一般来说,在未能得到正确的反事实时,人们常会把没有

    待学习
    开始阅读
  • 9

    COLUMN 1 巧克力消耗量越大,诺贝尔奖获奖人数越多?

    COLUMN 1 巧克力消耗量越大,诺贝尔奖获奖人数越多? 巧克力中的黄酮醇能够提高认知功能,这一结论早在动物实验等研究中得到证实。哥伦比亚大学的医师在2012年针对该结论进行数据分析,发现巧克力人均年消耗量越大的国家,诺贝尔奖获奖人数越多。该研究成果被刊登在临床医学界最具权威性的期刊之一《新英格兰医学杂志》上,引发了广泛议论。 论文作者得出的结论是:如果平

    待学习
    开始阅读
  • 10

    “实验”能证明因果关系

    两个变量的关系属于因果关系还是相关关系?判断这个问题的最可靠方法是“实验”,专业术语称为“随机对照试验”。 各位读者朋友可能都听说过“临床试验”。这是为了明确药物疗效与安全性所进行的试验。 例如,在小鼠实验中,将生病的小鼠“随机”分成两组,对比给予药物的小鼠(称为干预组)和不给予药物的小鼠(称为对照组)。如果摄入药物的小鼠痊愈率更高,则可认为药物有效。(见图

    待学习
    开始阅读
  • 11

    随机分组的必要性

    通过随机对照试验,便可以解答前言中提到的问题:定期接受代谢综合征体检就能长寿吗。 这种方法将研究对象人群随机分为两组:接受体检“干预”的组(干预组)和不接受体检的组(对照组)。这里的“干预”意为将原因与结果中相当于“原因”的事项(此处指体检)施加给研究对象人群。 为什么一定要进行随机分组?不能直接比较曾经接受过体检和未接受过体检的人吗? 其实曾经接受过体检和

    待学习
    开始阅读
  • 12

    “代谢综合征体检”与“长寿”是因果关系吗?

    实际上,丹麦曾经进行过调查体检效果的随机对照试验。下面介绍该研究的结果。丹麦也实行与日本类似的代谢综合征体检,为国民提供糖尿病、高血压等生活习惯病的诊断及保健指导服务。随机对照试验将30~60岁的成年男女随机划分为接受体检的干预组(约1.2万人)和不接受体检的对照组(约4.8万人),用了十年时间对两组人群做了追踪调查。① 在干预组中,体检结果为未来患病风险高

    待学习
    开始阅读
  • 13

    何谓“在统计学上具有显著性”?

    “干预组和对照组的差异在统计学上不具有显著性”,是指该差异可视为巧合所导致的误差。换句话说,“观测到的差异为偶然产物的概率”低于5%,则该差异可被视为“在统计学上具有显著性”,表示两组的差异属于无法用误差或巧合解释的“具有显著性的差异”;而该概率高于5%时,则该差异“在统计学上不具有显著性”, 两组的差异可用误差或巧合来解释。(见图表2-3)5%这个数值本身

    待学习
    开始阅读
  • 14

    定期接受体检并不能带来长寿

    丹麦的这项研究显示,接受体检未必就能长寿。不过,这项随机对照试验终归只是在丹麦国内进行的研究。评估体检是否有效是关乎国家整体健康政策的重要问题,仅参考一项随机对照试验的结果做出判断的话,会有很大的风险。因此,下面介绍几项其他国家或地区的随机对照试验的结论。考察多项研究时,可以采用“元分析”(meta-analysis)方法。元分析是指整合多项研究结果,从整体

    待学习
    开始阅读
  • 15

    投入1 200亿日元税金的代谢综合征体检

    尽管国外已有可靠证据表明体检不能带来长寿,日本仍在2008年启动了特定健康体检(俗称代谢综合征体检)和特定保健指导服务。 众所周知,这项政策的目的在于尽早发现并治疗生活习惯病,所有40岁以上的健康保险参保者都必须接受该体检。从2008年至2014年,日本为这项体检总计投入了大约1 200亿日元税金。 斥巨资引入的代谢综合征体检是否见效?为调查体检的效果,厚生

    待学习
    开始阅读
  • 16

    “医疗费用自付比例”和“健康”是因果关系吗?

    ③ 。 “医疗费用自付比例”和“健康”是因果关系吗? 近些年来,医疗费用增加成为日本社会普遍关注的问题。2015年,日本成为世界第三大高医疗费用支出国(占GDP比例),很多人看到这条新闻或许都会感到震惊。医疗费用高涨带来的危机感与日俱增。因此,是否应该提高老年人医疗费用的自付比例成了公众热议的话题。 2017年2月,70岁以下人口的医疗费用自付比例为30%,

    待学习
    开始阅读
  • 17

    兰德健康保险实验的结果

    该研究的干预组多达3组,并分别设置了不同的自付比例。分入这三组的研究对象加入研究组②~④的方案,而对照组则是自付比例0%的研究组①。 兰德健康保险实验的结果 下面来看兰德健康保险实验的结果。首先是各组支出的医疗费用。如图表2-4所示,研究组①(自付比例0%)的医疗费用明显高于其他三组。和研究组④(自付比例95%)相比,高出约为30%。由此可以认为,医疗费用自

    待学习
    开始阅读
  • 18

    除贫困阶层以外,提高自付比例对健康状况没有影响

    (数据来源)约瑟夫·纽豪斯等(1993) 除贫困阶层以外,提高自付比例对健康状况没有影响 上述结果并不值得惊奇。不过,除了这些结论,兰德健康保险实验还证实了医疗费用自付比例与人们的健康状况之间不存在因果关系。在高血压症等30项健康指标上,研究组①(自付比例0%)与研究组②~④之间未发现在统计学上具有显著性的差异。 换句话说,这项研究表明,即便医疗费用自付比例

    待学习
    开始阅读
  • 19

    COLUMN 2 整合多项研究的“元分析”

    COLUMN 2 整合多项研究的“元分析” 论证某两个变量之间是否存在因果关系的研究未必只有一例。不同研究者围绕同一主题撰写论文的现象非常普遍。有些使用的数据相同,有些使用的数据不同。 如果围绕同一主题的所有研究均得出相同的结论,那倒无妨。但有时某篇论文得出的结论是“存在因果关系”,而另一篇的结论是“不存在因果关系”。遇到这种情况,不能认为只有对自己研究有利

    待学习
    开始阅读
  • 20

    用现有数据重现与实验类似的环境

    随机对照试验的证据等级很高,但实施过程中会遇到不少困难。比如,可能很难对作为研究对象的个体或企业进行人为随机分组。研究对象可能会强烈反对,或者很多情况下出于伦理考虑,无法进行随机对照实验。 让我们用珠宝店的例子设想一下。你所在的珠宝店在全国共有100家店铺。如前文所述,你想明确广告给销售额带来的因果效应。如果可以组织随机对照试验,只需把100家店铺随机分成投

    待学习
    开始阅读
  • 21

    “医生性别”与“患者死亡率”是因果关系吗?

    下面介绍一项运用自然实验的研究。走进书店,能看到书架上摆着很多介绍“名医排行”的书籍。翻过这类书的人或许会发现,绝大多数“名医”都是男性。人们似乎大多抱有一种印象,认为名医肯定是男医生。然而,男医生真的比女医生更优秀吗? 本书的作者之一津川曾研究过这一课题。他分析了2011年至2014年因内科疾病在美国医院住院的超过100万名患者的数据,试图验证主治医生为男

    待学习
    开始阅读
  • 22

    女医生负责的患者死亡率更低

    津川等人的分析结果显示,女医生负责的患者的30天死亡率比男医生的患者低0.4%。(见图表3-1) 图表3-1 女医生负责的患者30 天死亡率更低 (注)本数据为对患者重症程度、医生特点等因素进行调整后,对就职于同一所医院的男医生和女医生(均为住院医师)进行比较的结果。柱状图顶部的竖线为“95% 置信区间”,表示推测值有95% 的概率属于该区间范围内。更严密地

    待学习
    开始阅读
  • 23

    “出生体重”与“健康”是因果关系吗?

    日本有这样一句老话:先生小娃再养大。说的是婴儿出生时体重越轻越好,生下后再把孩子养胖更好。在剖宫产技术尚不成熟的年代,为降低产妇因为生产而死亡的风险,才会出现这句老话。 或许是受这种观念的影响,日本的低出生体重儿(出生体重低于2 500克)比例要高于其他国家。(见图表3-2) 图表3-2 日本的低出生体重儿多于他国——各国低出生体重儿的比例 (注)低出生体重

    待学习
    开始阅读
  • 24

    出生体重较重的婴儿更健康

    美国、挪威、加拿大、中国台湾采用大量双胞胎数据展开的研究证实,出生体重较重的婴儿长大后的成绩、学历、收入和健康状况更好。本书作者之一的中室曾利用日本的双胞胎数据进行研究,也发现出生体重较重的孩子初中毕业时的成绩更好。从孩子的角度来考虑,“先生小娃再养大”的建议并不对。 近年来,不少经济学研究成果支持“胎儿起源说”。胎儿起源说认为,胎儿时期的发育环境对之后的人

    待学习
    开始阅读
  • 25

    COLUMN 3 被动吸烟会增加心脏病的患病风险吗?

    COLUMN 3 被动吸烟会增加心脏病的患病风险吗? 日本国立癌症研究中心实施的元分析研究证实了被动吸烟与患肺癌之间确实存在因果关系。不过被动吸烟引发的疾病不只有肺癌。使用阿根廷的数据进行的一项研究表明,被动吸烟与心肌梗死之间也存在因果关系。 自2005年世界卫生组织(WHO)批准《烟草控制框架公约》以来,阿根廷迅速加强了对烟草的控制。然而,随着阿根廷地方分

    待学习
    开始阅读
  • 26

    模仿实验的“准实验”

    自然实验是利用观测数据和外生冲击,找到类似随机对照试验的环境。然而,日常生活中很少出现法律制度变更、自然灾害等外生冲击,很难找到可视为自然实验的环境。在这种情况下,我们应该怎么做呢? 本章开始介绍“准实验”。准实验是对实验的“模仿”,即通过观测数据和统计学方法,打造出与实施随机对照试验相类似的状态。关于这里所说的“统计学方法”,本书将介绍以下4种。 双重差分

    待学习
    开始阅读
  • 27

    前后比较毫无意义

    让我们回到珠宝店的例子。你所在的珠宝店在2014年圣诞节期间没有投放广告,当年12月的销售额为1 000万日元;而2015年的圣诞季商战中大规模投放了报纸广告,当年12月的销售额是1 400万日元。 减去投放广告所花费的100万日元,2015年12月的销售额比上一年同期增长了300万日元。(见图表4-1) 图表4-1 通过前后比较,能推算出广告的效果吗? 我

    待学习
    开始阅读
  • 28

    不能使用实验前后测分析的两个原因

    为什么不能使用实验前后测分析?原因有二。第一,这种方法没能考虑到随时间产生的自然变化(“趋势”)所造成的影响。以珠宝店为例,2015年销售额增长也许只是因为当年经济形势更好,即使不投放广告或许也能卖出1 400万日元。“趋势”的形成与投放广告与否无关,但实验前后测分析容易将其误视为广告的效果。 第二,是“回归平均”的可能性。这是一种统计学现象,在不断收集数据

    待学习
    开始阅读
  • 29

    去年的销售额为“反事实”时,前后比较才有效

    不过,实验前后测设计在一些特殊案例中也可以使用。我们继续思考图表4-1的事例。 要证明2014年和2015年的销售额之差(400万日元)是广告的因果效应,必须满足一个条件,即2015年如果没有投放广告,就会实现和2014年完全相同的销售额。 换句话说,2014年的销售额必须可以代表“如果2015年未投放广告”的反事实。(见图表4-2) 图表4-2 可以使用实

    待学习
    开始阅读
  • 30

    实验前后测设计的改良版——双重差分法

    “双重差分法”是实验前后测设计的改良版。它与实验前后测设计不同之处在于,双重差分法需要代表反事实的“对照组”。 要采用双重差分法,必须分别获取干预组与对照组在实验前后两个时点的数据。顾名思义,这种方法需要两个“差异”数据。一个是干预前后的“差异”(与实验前后测设计推算的效果相同);另一个则是干预组与对照组的“差异”。这种方法用两个“差异”的差异来推算干预的效

    待学习
    开始阅读
  • 31

    双重差分法成立的两个前提条件

    双重差分法成立必须满足两个前提条件。 第一,“干预组和对照组在投放广告之前的销售额趋势平行”。B地区店铺的销售额代表了A地区店铺如果未投放广告时的反事实状态。因此,A地区店铺和B地区店铺至少在干预前必须为“可比较”的组。换句话说,A地区和B地区在投放广告之前的销售额必须具有相同的“趋势”(图表4-8中体现的倾斜程度)。 图表4-8 双重差分法的前提条件 不过

    待学习
    开始阅读
  • 32

    “保育所数量”与“母亲就业”是因果关系吗?

    下面介绍一项应用双重差分法的研究。 “没上成保育园,日本去死!”这句话登上了2016年日本U-CAN新语及流行语大奖的候选名单。因孩子上不成保育园① 而不得不辞去工作的母亲的这句肺腑之言使日本社会意识到保育园入园难问题的严重性。这句话引发的关注也促使政府制定了紧急措施,放宽了针对保育园的规定。 然而,增设认可保育所真的能促进母亲就业吗?这个问题还有待慎重探讨

    待学习
    开始阅读
  • 33

    增设认可保育所不会提升母亲的就业率

    对这个问题,我们也需要认真思考保育园与母亲就业的关系属于因果关系还是相关关系。究竟是“因为有保育园,所以母亲去就业”(因果关系),还是“母亲就业率高的地区保育园数量也多”(相关关系)? 增设认可保育所不会提升母亲的就业率 东京大学的朝井友纪子、一桥大学的神林龙和麦克马斯特大学的山口慎太郎针对这一问题展开了研究。他们采用1990年到2010年间日本各行政区的保

    待学习
    开始阅读
  • 34

    “最低工资”与“就业”是因果关系吗?

    这篇论文的作者之一山口指出,即使增设认可保育所并不会对母亲就业产生因果效应,但保育园是由拥有专业知识和技能的保育员所组成的专业组织,可能对儿童的成长和健康产生更多的积极影响。实际上,以往很多经济学研究已证实,优质幼儿教育的投资回报率极高。从这个角度来看,或许正如山口所言,增设认可保育所的目的与其说是促进母亲就业,不如定位为为孩子开拓更好的未来更恰当。 “最低

    待学习
    开始阅读
  • 35

    提高最低工资不会减少就业

    这项研究中的第一个差异是1992年前后两个州的就业率差异,第二个差异是新泽西州(干预组)和宾夕法尼亚州(对照组)的就业率差异。二人试图通过这两个“差异”推算出提高最低工资对就业的因果效应。 提高最低工资不会减少就业 卡德和克鲁格的分析发现,提高最低工资不会减少就业。③ 此外还发现,提高最低工资导致了新泽西州企业提高了产品价格。也就是说,企业并未通过裁员来克服

    待学习
    开始阅读
  • 36

    COLUMN 4 “不快点睡觉,妖怪就要来了”是正确的教育方法吗?

    COLUMN 4 “不快点睡觉,妖怪就要来了”是正确的教育方法吗? 美国有一种名为“恐吓从善”(scared straight)的教育方法。通过恐吓让孩子认识到遵守规矩的必要性。例如通过重现交通事故现场让孩子学习遵守交通法规的重要性,或者带不良少年参观监狱以促使他们改过自新。 日本也有一些父母会为了督促孩子睡觉,跟孩子说“不快点睡觉,妖怪就要来了”。看来“恐

    待学习
    开始阅读
  • 37

    广告费打折,该怎样利用

    本章将介绍“工具变量法”。 让我们再回到珠宝店的事例。你想评估广告对销售额有没有因果效应。安排下属调查后,遗憾地发现投放广告的店铺和不投放广告的店铺很难被视为可比较的组。因为投放广告与否很大程度上是由各店铺的店长决定的,投放广告的店铺与不投放广告的店铺相比,店长的干劲可谓天差地别。这种情况下,广告与销售额之间可能实际上不存在因果关系,但“店长的干劲”这个混杂

    待学习
    开始阅读
  • 38

    工具变量法成立的两个前提条件

    工具变量需要满足两个条件。第一,工具变量要能够影响原因,但不直接影响结果。来看图表5-2。图中箭头表示原因与结果之间的因果关系,如“原因→结果”。箭头表示两者之间存在因果关系,其起点是原因,终点是结果。 图表5-2 第三变量可作为工具变量的条件(1) 此时,要使工具变量成立,必须满足的条件是:“工具变量→原因”成立,且“工具变量→结果”不成立。 第二个条件如

    待学习
    开始阅读
  • 39

    “看电视”与“学习能力”是因果关系吗?

    下面就来介绍一项应用了工具变量的研究。 不少家长担心孩子看电视时间过长。日本厚生劳动省的统计显示,小学六年级学生周一到周五每天约有2.2小时、周末每天约有2.4小时在电视机前度过。花这么多时间看电视,父母担心也在所难免。 很多人坚信电视会对孩子的成长、健康以及学习能力带来不良影响。美国俗语甚至把电视称作“傻瓜盒子”(idiot box)。 不过,看电视真的会

    待学习
    开始阅读
  • 40

    看电视可以提高偏差值

    根茨科等人的分析结果出人意料:20世纪40年代至50年代前期,年幼时经常看电视的孩子在升入小学后的学力测试中,偏差值高出0.02。此外,也没有发现看电视对做作业的时间、升学志愿等方面产生不良影响。分析还指出,在英语不是母语,或者母亲学历较低,或者非白人人种的孩子当中,看电视还对成绩提高产生了显著效果。 根茨科等人认为,很多家长之所以不愿意让孩子看电视,或许是

    待学习
    开始阅读
  • 41

    “母亲的学历”与“孩子的健康”是因果关系吗?

    哥伦比亚大学的珍妮特·克里(Janet Currie)等人的研究也应用了工具变量法。经济学家克里曾通过多项研究证实幼年时孩子的健康状况会对长大后的学历及收入产生显著影响。而她接下来试图论证的是“幼年时孩子的健康状况取决于什么”。 克里认为母亲学历高或许会对孩子的健康状况产生积极影响,于是采用美国两百多万名母亲的数据进行了研究。 母亲学历高真的对孩子健康状况有

    待学习
    开始阅读
  • 42

    母亲上过大学,孩子更健康

    克里等人的研究显示,本科以上高学历的母亲生育早产儿或低出生体重儿的概率更低,婴儿出生时的健康状况更好。究其原因,本科以上高学历母亲在怀孕期间吸烟的概率较低,接受产检的概率也更高。也就是说,上大学使她们养成了利于孩子健康的好习惯。 克里等人的研究让人们关注到教育带来的好处。芝加哥大学的迈克尔·格林斯通(Michael Greenstone)等人通过研究发现,股

    待学习
    开始阅读
  • 43

    COLUMN 5 增加女性管理层成员能促进企业成长吗?

    COLUMN 5 增加女性管理层成员能促进企业成长吗? 2016年,安倍内阁出台“女性活跃推进法”。这项法案作为成长战略的一环,为女性管理者的比例设置了数据目标。按照这个规定,企业和地方政府必须制订并公开实现女性管理者比例目标的行动计划。某项调查结果显示,女性董事人数较多的企业业绩更好(图表5-4),至于二者之间是因果关系还是相关关系,还有待更严谨的论证。

    待学习
    开始阅读
  • 44

    利用“49人店铺”与“50人店铺”的差异

    本章将介绍“断点回归设计”。让我们继续以珠宝店为例。就职于珠宝店的你还在为如何论证广告的效果而一筹莫展。这时,下属向你提出了一个方案:只有员工人数50人以上(含50人)的大型店铺才在年底圣诞季商战期间投放广告。 对此,你产生了一个想法:按照这个方案,员工人数49人的店铺不投放广告,而50人的店铺投放广告。不过,49人的店铺和50人的店铺除了是否投放广告之外,

    待学习
    开始阅读
  • 45

    断点回归设计成立的前提条件

    用断点回归设计推算因果效应,必须满足一个重要的前提条件:在连续变量的断点附近,没有发生过影响结果的其他事件。比如,假设员工人数50人以上(含50人)的店铺不仅可以投放广告,还会根据销售额发放奖金。在这种情况下,就无法判断断点的“跳跃”是广告的效果还是奖金的效果了。

    待学习
    开始阅读
  • 46

    “朋友的学力”与“自己的学力”是因果关系吗?

    下面介绍几项应用断点回归设计的研究成果。每当备考季节临近,总有不少家长祈祷自家孩子能够超常发挥,考入偏差值高的学校。他们可能认为在偏差值高的学校就读的肯定都是学习能力强的学生,即使自家孩子的实力可能稍有不足,但能和学霸朋友们一起学习,孩子的学习能力自然也会随之提高。可能正因为他们的这种想法,“学生学习能力高”的学校附近房价和地价才会连年攀升吧。 经济学领域将

    待学习
    开始阅读
  • 47

    和学霸在一起,也无法提高自己的学习能力

    安格瑞斯特等人的研究结果显示,在波士顿和纽约的所有学校,断点前后并未观测到学习能力的“跳跃”现象。 关于“同群效应”是否存在尚无定论,但也有不少探讨和学习能力强的人做朋友对学习能力的因果效应的研究得出了和安格瑞斯特等人相同的结论。 例如,美国全国经济研究局(NBER)的杰弗里·克林(Jeffrey R. Kling)等人对美国政府实施的一项大型随机对照试验“

    待学习
    开始阅读
  • 48

    “医疗费用自付比例”与“死亡率”是因果关系吗?

    再来介绍一项应用了断点回归设计的研究。在第2章中,我们探讨了医疗费用自付比例的问题。一些观点建议通过提高自付比例来控制医疗费用的增加,也有人担忧这样做会迫使老年人减少就医次数,对其健康状况造成不利影响。针对这个课题,加拿大西蒙弗雷泽大学的重冈仁利用日本的数据进行了研究。 重冈着眼于日本老年人在年满70岁以后医疗费用自付比例从30%降至10%的制度,将70岁作

    待学习
    开始阅读
  • 49

    提高老年人医疗费用的自付比例对死亡率没有影响

    第2章介绍的兰德健康保险实验(参考正文第36页)得出的结论是,提高自付比例对健康状况没有影响。然而在美国,由于人们年满65岁就会自动加入国家公共医疗保险(联邦医疗保险,Medicare),所以兰德健康保险实验中未包括65岁以上的老年人。重冈这项研究的卓越之处在于,对兰德健康保险实验未能覆盖到的老年人群体自付比例与健康和死亡率之间的因果关系做了论证。 提高老年

    待学习
    开始阅读
  • 50

    COLUMN 6 “激素替代疗法”的陷阱

    COLUMN 6 “激素替代疗法”的陷阱 前面曾提到随机对照试验的证据等级比较高。下面就来介绍一项研究,它用随机对照试验完全逆转了用观测数据得出的结论,也因此而让“激素替代疗法”受到了广泛关注。 众所周知,女性患心肌梗死等动脉硬化导致的疾病的风险要低于男性。但女性绝经后,患心肌梗死的概率会增至和男性同等的水平。因此有假说推测是雌激素降低了动脉硬化的风险。 于

    待学习
    开始阅读
  • 51

    找出相似的店铺

    本章介绍最后一种准实验方法——“匹配法”。我们依旧用珠宝店的事例来思考。假设你还在为投放广告的店铺和不投放广告的店铺不可比较一事发愁。 这时,你突然产生了一个想法。你所在的珠宝店目前共有100家店铺。其中30家投放了广告,70家未投放广告。从未投放广告的70家店铺中,选出和投放广告的30家店铺情况相似的30家店铺,将二者进行比较不就好了吗?这便是匹配法的思路

    待学习
    开始阅读
  • 52

    整合多个协变量的“倾向得分匹配法”

    图表7-1 找出相似个体的“匹配法” 整合多个协变量的“倾向得分匹配法” 协变量未必只有一个。如果只考虑店长年龄相同的店铺,那么从对照组中找到符合这个条件的店铺进行匹配并不难。然而,如果存在多个协变量,恐怕就不一定能从对照组中找到所有条件都完全一样的店铺了。 这种情况下,我们可以使用匹配法中的“倾向得分匹配法”(Propensity Score Matchi

    待学习
    开始阅读
  • 53

    倾向得分匹配法成立的前提条件

    达到了这个状态,我们才可以说构造出了两个可比较组:考虑多种属性,两家店铺投放广告的可能性相同,只是碰巧其中一家投放了广告,而另一家没投放广告。也就是说,这种情况下,对照组才能代表“如果干预组没有投放广告”的反事实,我们也才能明确干预组和对照组的销售额差异200万日元(1 200万日元-1 000万日元)是广告带来的因果效应。 倾向得分匹配法成立的前提条件 倾

    待学习
    开始阅读
  • 54

    “大学偏差值”与“收入”是因果关系吗?

    第二个前提条件是所有协变量都必须用来计算倾向得分。 “大学偏差值”与“收入”是因果关系吗? 下面介绍普林斯顿大学的克鲁格等人撰写的两篇论文,是运用匹配法进行的出色研究。 日本被称为学历社会,但即使都是大学毕业生,之后的人生也并不会相同。一桥大学的神林龙等人的研究显示,20世纪90年代大学毕业生和高中毕业生的工资差距并未拉大,但大学毕业生之间的工资差距却有所增

    待学习
    开始阅读
  • 55

    上偏差值高的大学,收入也不会增长

    然后比较二人考上的两所大学,大学A的偏差值要比大学B更高。假设其中一人选择就读大学A,而另一人选择了专业对自己更有吸引力的位于当地的大学B。那么只要对这两个人进行比较,就能推算出就读偏差值高的大学对未来收入的因果效应。 上偏差值高的大学,收入也不会增长 匹配法的分析结果出乎意料。在考上某大学且就读于该大学的学生组(干预组)和同样考上该大学但最终选择了偏差值较

    待学习
    开始阅读
  • 56

    COLUMN 7 商务版随机对照试验“A/B测试”

    COLUMN 7 商务版随机对照试验“A/B测试” 随机对照试验在商业领域也逐渐得到了广泛应用。“A/B测试”就属于这种情况。 让我们再回到珠宝店的事例。热销产品的首饰盒现有两款候选设计A和B,你在犹豫应该选用哪一款。一名销售员断定设计A更符合公司的风格,另一名销售员则说其他公司的畅销产品都与设计B很像。即使选择了设计A的首饰盒,可能你也会情不自禁地想象反事

    待学习
    开始阅读
  • 57

    假如现有数据都不适合用来评估因果关系……

    就职于珠宝店的你盯着面前的数据。公司在一本半年前创刊的杂志上投放广告,今天你收到了投放广告后的销售数据。领导让你根据这些数据分析下一季度是否应该继续在该杂志上投放广告。然而遗憾的是,该杂志创刊没多久,无法用断点回归法、双重差分法等准实验方法进行分析。 当然,运用随机对照试验或准实验进行分析,正确评估因果效应的可能性会更大。然而,在实际工作和生活中,绝大部分数

    待学习
    开始阅读
  • 58

    画一条表示数据的“回归线”

    下面先用一元回归分析介绍回归分析的基本概念。假设有4个数据如图表8-1所示,每个数据都代表一种原因与结果的组合。你希望能确定这两个变量之间是否存在因果关系。 所谓回归分析,就是在这4个点之间画出一条“回归线”。如果能画出回归线,这条线的“倾斜程度”就代表了每增加一个单位的原因会给结果带来的变化。也就是说,回归线的倾斜程度便是原因对结果的“因果效应”。 下面讲

    待学习
    开始阅读
  • 59

    用“多元回归分析”排除混杂因素的影响

    如果想在一元回归分析中用回归线的倾斜程度代表因果效应,必须满足“不存在混杂因素”的前提条件。然而,现实中很少有情况符合这个条件。多元回归分析则可以排除混杂因素的影响。多元回归分析使混杂因素的值保持固定不变① ,以便我们能够画出表示原因与结果的关系的“回归线”,并根据回归线的倾斜程度来评估因果效应。 下面我们以饮酒与肺癌的关系为例进行说明。假设我们现在怀疑饮酒

    待学习
    开始阅读
  • 60

    COLUMN 8 因果推理的发展史

    经济学及统计学领域的因果推理 因果推理在经济学领域的历史其实并不长。20世纪40年代,挪威奥斯陆大学的经济学者特里夫·哈维默(Trygve Magnus Haavelmo)在论文中使用了与反事实概念相类似的表述,但这一表述从严格意义上来说还算不上对反事实的准确定义。 进入20世纪90年代后,出现了一些较大变化。当时哈佛大学经济学院的著名计量经济学家吉多·因本

    待学习
    开始阅读
  • 61

    内部效度与外部效度

    以上我们学习了因果推理的多种方法。在这个补论中,我们将介绍一下这些方法的“有效性”与“局限性”。先来解释两个用来评价分析结果有效性的概念:“内部效度”和“外部效度”。 所谓内部效度,是指两个变量之间的因果关系的确定程度,即对研究对象群体再次施加相同干预后,会出现相同结果的程度;而外部效度则指对研究对象之外的群体施加相同干预后,会出现相同结果的程度。 我们来思

    待学习
    开始阅读
  • 62

    随机对照试验也有局限性

    正如前面提到的,本书介绍的各种方法虽然都是学术上成立的方法,但并非完美无缺。我们只有了解每种方法的局限性,对所得结果的有效性进行充分的探讨,才能得出“两个变量之间是否存在因果关系”这一问题的准确答案。 本书虽然也介绍了多种利用自然实验或准实验根据观测数据判断因果关系的方法,不过就判断因果关系这一点而言,随机对照试验毫无疑问要优于利用观测数据进行的研究。不过,

    待学习
    开始阅读
  • 63

    补论2 因果推理的五个步骤

    随机对照试验 随机对照试验通过投硬币、随机数表、抽签等方式,将研究对象人群随机分为接受干预的组(干预组)和不接受干预的组(对照组),使两组成为可比较的组,用对照组的数据替换干预组“如果没有受到干预”的反事实。 COLUMN 2 整合多项研究的“元分析” 论证某两个变量之间是否存在因果关系的研究未必只有一例。不同研究者围绕同一主题撰写论文的现象非常普遍。有些使

    待学习
    开始阅读
  • 64

    后 记

    第3章 男医生比女医生更优秀吗? 利用与实验类似的偶发现象进行自然实验 用现有数据重现与实验类似的环境 随机对照试验的证据等级很高,但实施过程中会遇到不少困难。比如,可能很难对作为研究对象的个体或企业进行人为随机分组。研究对象可能会强烈反对,或者很多情况下出于伦理考虑,无法进行随机对照实验。 让我们用珠宝店的例子设想一下。你所在的珠宝店在全国共有100家店铺

    待学习
    开始阅读
  • 65

    参考文献

    也许有人会想双胞胎的体重也存在差异吗?一般而言在母体中营养状况相对更好的胎儿体重会更重,也会先出生。当然,双胞胎的出生顺序是偶然的,他们自然分为体重较重的婴儿和体重较轻的婴儿也可看作一种自然实验。 出生体重较重的婴儿更健康 美国、挪威、加拿大、中国台湾采用大量双胞胎数据展开的研究证实,出生体重较重的婴儿长大后的成绩、学历、收入和健康状况更好。本书作者之一的中

    待学习
    开始阅读

Local EPUB Text

前 言

在本书的开篇,我先请各位读者回答以下几个问题。

定期接受代谢综合征体检就能长寿吗?

看电视会导致孩子学习能力下降吗?

上偏差值① 高的大学收入就会更高吗?

想必很多人的回答都是肯定的。

不过,经济学的权威研究已经推翻了上述全部说法。

很多人之所以会做出肯定回答,是因为他们混淆了“因果关系”和“相关关系”。建议那些不假思索做出肯定回答的人务必读一读本书。他们读后定会收获全新的重要发现。

我们来看下面这个例子。

人们常说体力好的孩子往往学习能力也更强。图表1体现了日本各行政区孩子的体力测试与学力测试平均值的关系。从图表中可见,学生体力测试分数高的行政区,学力测试的正确率也更高。

那么,我们可否得出结论,认为他们“因为体力好,所以学习能力强呢”?换句话说,要想提高孩子的学习能力,是否应该先增强孩子的体力呢?

图表1 体力好的孩子学习能力强?——小学生的体力和学习能力的关系

(注)该图表体现了日本各行政区体力测试和学力测试的平均值的关系。由笔者根据《2014 年度全国体力、运动能力及运动习惯等调查》(文部科学省)和《2014 年度全国学力及学习情况调查》(国立教育政策研究所)的数据制作而成。

当然没有这回事儿。在经济学领域,“两个事件中,一方为原因,另一方为结果”的状态被称为存在因果关系。如果体力好这项“原因”会产生学习能力强的“结果”,便可以说二者之间存在因果关系。另一方面,“两个事件相互关联,但不存在因果关系”的状态被称为相关关系。在相关关系中,即使“看似是原因的事件”再次出现,也得不到期望中的“结果”。可见分清因果关系和相关关系是十分重要的。

“因为体力好,所以学习能力强”,其言下之意是“只要增强体力,(即便整天不学习)学习能力就会有所提高”。这种说法显然有问题,因此体力和学习能力的关系不是因果关系,而是相关关系。当然,即使增强孩子的体力,孩子的学习能力也不一定会提升。

这个事例教给我们一个非常重要的教训:混淆因果关系和相关关系,会导致错误判断。

在关于儿童的体力和学习能力的这个事例中,大多数人应该都能分清因果关系和相关关系。不过我们的生活中充斥着五花八门的信息,其中不乏听起来很有道理的说法。遗憾的是,很多人面对类似信息,都会不假思索地把相关关系视为因果关系。现在,让我们再回过头来思考本书开篇提出的三个问题吧。

定期接受代谢综合征体检就能长寿吗?

看电视会导致孩子学习能力下降吗?

上偏差值高的大学收入就会更高吗?

要让这三个说法成立,“代谢综合征体检”和“长寿”、“看电视”和“孩子的学习能力”、“大学的偏差值”和“收入”之间必须存在因果关系,而非相关关系。那么,每组事件之间的关系究竟是因果关系还是单纯的相关关系呢?下面让我们来依次探讨。

定期接受代谢综合征体检就能长寿吗?

学校或公司经常为我们安排体检② ,其中最常见的是“代谢综合征体检”。想必很多人相信,通过代谢综合征体检掌握自己的健康状况,预防生活习惯病,或者发现潜在疾病,我们就会更长寿。③

图表2的柱状图显示,在代谢综合征体检中接受了生活习惯指导的人在第二年出现了腰围变小、体重下降、血糖或血压降低等变化。

图表2 定期接受代谢综合征体检的人身体健康吗?——代谢综合征体检与健康的关系

(注)代谢综合征体检结果为生活习惯病患病风险高的人提供保健指导。指导包括动机支援(原则上只进行1 次)和积极支援(持续定期指导)。本图表中将参加积极支援的人称为“接受体检和指导的人”,未参加积极支援的人称为“未接受体检和指导的人”。血糖值为糖化血红蛋白(HbA1c),血压为收缩压数值。

(数据来源)摘自第14 次保险人体检及保健指导研讨会的资料(厚生劳动省2015 年6 月26日),有部分变更。

乍一看,似乎确实可以说接受代谢综合征体检就会更健康、更长寿。

不过,请不要急于得出结论。这份数据真的可以说明“因为定期接受了代谢综合征体检,所以长寿”吗?回答这一问题的关键在于弄清代谢综合征体检和健康是因果关系还是仅为相关关系。这份数据还可以如此解读:并非“因为定期接受了代谢综合征体检,所以长寿(因果关系)”,而只不过是“关注健康、定期接受代谢综合征体检的人更长寿”(相关关系)而已。

先来公布答案。经济学的权威研究证实,代谢综合征体检和长寿之间不存在因果关系。因此,“我每年都接受体检,所以身体很健康”是一种很危险的认知。详细讲解请见第2章。

看电视会导致孩子学习能力下降吗?

“我家孩子总是看电视”,想必不少家长都有这个烦恼。据日本厚生劳动省统计,小学六年级学生平日平均每天会在电视机前度过约2.2小时,周末平均每天在电视机前度过约2.4小时。

图表3也显示,每天看电视时间超过3小时的孩子比看电视时间少于1小时的孩子的学力测试成绩低。光从这个数据来看,似乎看电视确实会对孩子的学习能力造成不良影响。

图表3 经常看电视的孩子学习能力差吗?

(注)学力测试结果采用的是小学六年级学生的“全国学力学习情况调查”中语文和算术的答题正确率。A 为基础题,B 为应用题。

(数据来源)日本文部科学省《2015 年度全国学力调查》。

但是,我们必须认真思考,看电视和孩子学习能力之间的关系属于因果关系还是相关关系。也就是说,要分清是“因为看电视,所以学习能力下降”(因果关系),还是只是“学习能力差的孩子看电视时间更长”(相关关系)而已。

关于这个问题,我们也先公布答案。经济学的权威研究证实,看电视的时间和学习能力之间确实存在因果关系,但研究发现,看电视时间越长,学习能力不但不下降,反而提升。详细讲解请见第5章。

上偏差值高的大学收入就会更高吗?

很多人坚信“考上偏差值高的大学,未来就能拿高薪”。从实际数据中也能看出,高偏差值大学的毕业生具有年收入更高的倾向。(见图表4)

图表4 高偏差值大学的毕业生收入更高吗?——各大学毕业生的平均年收入(前10 位大学)

(数据来源)DODA 网:https://doda.jp/careercompass/ranking/daigaku_nenshu.html.

思考这个问题的关键依然是,大学偏差值和年收入之间是因果关系还是相关关系。或许不是“因为上了偏差值高的大学,所以收入高”(因果关系),而只是“有潜力将来获得高薪的人才多集中在偏差值高的大学”(相关关系)。

关于这个问题,我们也先公布答案。经济学的权威研究证实,大学偏差值和未来的年收入之间不存在因果关系。上偏差值高的大学并不代表步入了人生的康庄大道。详细讲解请见第7章。

或许有人不明白,不存在因果关系又有什么影响。或许有人会认为:接受代谢综合征体检总好于不体检,控制看电视的时间总比抱着电视不放要强,而上偏差值高的大学总比上偏差值低的大学要好吧。

不过不要忘了,我们采取任何行动都需要花费可观的金钱和时间。偏信那些看似存在因果关系的“无稽之谈”,把它们作为行动依据,不仅得不到预期的成效,还白白浪费了金钱和时间。如果依据因果关系有效地把这些金钱和时间利用起来,我们获得满意的成果的概率也会更高。

理解“因果推理”,便可摆脱传统观念的束缚

两个事件之间是否真的存在因果关系?为解答这一问题,近年来经济学研究倾注了巨大的心血。我们把正确区分因果关系和相关关系的方法论称为“因果推理”。

“因果”,顾名思义,即“原因与结果”。“推理”则指“根据某个事件推导其他事件,即经过推测和推断得出结论的过程”。换句话说,就是分析并判断两个事件是否分别为原因和结果的过程。

在日常生活中,只要理解了因果关系和相关关系的差异,训练自己思考是否存在因果关系,便可以摆脱偏见或无稽之谈的束缚,做出正确的判断。本书的目的便在于用浅显易懂的方式详尽讲解因果推理最根本的思维方法。读者可以把本书当作因果推理的“入门的入门”。既然是入门的入门,自然不涉及经济学的基础知识,更不会用到任何公式。

此外,本书还将用大量篇幅介绍经济学中运用因果推理与数据得出的研究成果,说明如何解读这些研究。当今社会,“大数据”已成为脍炙人口的词汇,任何人都能轻而易举地分析数据,但是这并不代表所有人都能正确解读数据分析的结果。若想在大数据时代获得一席之地,不仅要学会分析数据,更要掌握解读数据分析结果的能力。

在此请允许我们做个自我介绍。本书作者之一的中室牧子是教育经济学家,多年来一直致力于运用数据和经济学方法研究何种教育方法能提高儿童的学力及能力。她所提倡的不是基于个人经验的教育论,而是呼吁根据具有因果关系的科学依据来制定育儿及教育政策。

另一名作者津川友介是医生兼医疗政策专家,致力于运用大数据研究如何在改善医疗质量的同时抑制医疗费用的增加。津川师从美国著名医疗经济学家、任教于哈佛大学的约瑟夫·纽豪斯(Joseph Newhouse)以及最早创建因果推理体系的唐纳德·鲁宾(Donald B. Rubin),从他们那里学会了因果推理的思维方法。

在美国,“因果推理”是大学的课程内容之一。商务和政治场合自不必说,日常会话中很多人也会有意识地在言谈中注意因果推理的应用。而在日本却几乎没有系统学习因果推理的机会。或许因为这个原因,电视和报纸上常有报道将一些相关关系描述成因果关系,甚至企业管理者和政策制定负责人也常把因果关系和相关关系混为一谈。

教育领域和医疗领域里充斥着无数因果关系混淆的无稽之谈。本书以生活中必不可少的教育和医疗为例,尽可能让各位读者在阅读本书后掌握因果推理的基本思维方法。

19世纪杰出的美国思想家、作家拉尔夫·爱默生说过这样一句话:“浅薄的人相信运气,强大的人相信因果。”在这个数据泛滥的时代,“因果推理”是我们每个人必备的素养。

① 日本普遍使用的用来评定学生考试成绩的方法。偏差值=(得分-平均分)÷标准差×10 + 50。

② “体检”可分为“健康检查”和“疾病筛查”两种。前者旨在预防代谢综合征等生活习惯病,后者旨在及早发现特定疾病,如癌症筛查等。此处的“体检”指的是“健康检查”。

③ 代谢综合征体检的指标包括腰围、中性脂肪、高密度脂蛋白胆固醇、血压和空腹血糖。也有观点质疑这些诊断指标缺乏科学依据。