bangst

学习进度

阅读时长

未满 1 分钟

最近阅读：未开始阅读

核心概念

待提炼

章节学习

1
前言
在本书的开篇，我先请各位读者回答以下几个问题。定期接受代谢综合征体检就能长寿吗？看电视会导致孩子学习能力下降吗？上偏差值① 高的大学收入就会更高吗？想必很多人的回答都是肯定的。不过，经济学的权威研究已经推翻了上述全部说法。很多人之所以会做出肯定回答，是因为他们混淆了“因果关系”和“相关关系”。建议那些不假思索做出肯定回答的人务必读一读本书。他们读
待学习
开始阅读
2
何谓“因果关系”和“相关关系”？
让我们再来看看因果关系和相关关系的概念。如果两个事件中，前一个事件是后一个事件的原因，后一个事件是前一个事件的结果，则两个事件之间存在“因果关系”；如果一个事件变化后，另一个事件也随之发生变化，但二者不属于原因和结果的关系，则称它们之间存在“相关关系”① 。（见图表1-1）存在相关关系的两个事件之间虽然有关联，但不属于因果关系。图表1-1 因果关系与相关
待学习
开始阅读
3
判断因果关系的三个要点
两个变量的关系是否真的是因果关系？解答这个问题所需的思维方法便是“因果推理”。判断因果关系的三个要点判断两个变量属于因果关系还是相关关系时，可以通过以下三个问题进行质疑。 ①是否“纯属巧合”？ ②是否存在“第三变量”？ ③是否存在“逆向因果关系”？ ①是否“纯属巧合”？如果有人提出“温室效应的加剧导致海盗数量下降”，大家肯定觉得荒唐，但如图表1-2所示
待学习
开始阅读
4
证明因果关系需要“反事实”
如果两个变量之间存在因果关系，当原因再次出现时，相同的结果也会出现，而不存在“纯属巧合”“混杂因素”或“逆向因果关系”。另一方面，如果两个变量的关系只是相关关系，那么就会存在“纯属巧合”“混杂因素”或“逆向因果关系”中的某一种情况。在相关关系的情况下，即使原因再次发生，也几乎不会得到相同的结果。证明因果关系需要“反事实” 那么，应该如何证明不存在上述三种情
待学习
开始阅读
5
没有时光机就制造不出反事实吗？
要证明因果关系的存在，必须对“事实”中原因发生后的结果与“反事实”中原因未曾发生时的结果进行对比。没有时光机就制造不出反事实吗？ “反事实”是因果推理中最为重要的概念，下面让我们举例详细介绍。假设你在一家经营全国连锁珠宝店的企业担任公关部部长，正在考虑通过投放广告来提高销售额。所幸聘请当红小生制作的报纸广告十分具有吸引力，投放时期也定在12月上旬，刚好配
待学习
开始阅读
6
用“最贴切的值”替换反事实
最早创建因果推理体系的哈佛大学统计学家唐纳德·鲁宾把这个问题称为“因果推理中的根本问题”。然而，要证明因果关系，反事实是必经之路。用“最贴切的值”替换反事实其实，克服“因果推理中的根本问题”，制造反事实，才正是以因果推理为基础的各种方法的根本所在。为此，经济学家会想方设法，用最贴切的值来替换无法观测到的“反事实的结果”。让我们再回到珠宝店的事例。假设你
待学习
开始阅读
7
只有“可比较”的组才能替换
这样一来，广告对整个企业的因果效应就可以用有广告组的平均销售额（1 500万日元）减去无广告组的平均销售额（1 000万日元）求得，即500万日元（1 500万日元-1 000万日元）。只有“可比较”的组才能替换其实，只要满足一个条件，上述思路便可以成立。这个条件就是：有广告组和无广告组必须是“可比较”的。假设有广告组位于大城市，当地居民收入很高。而无
待学习
开始阅读
8
想象不出正确的反事实就会被无稽之谈蒙蔽吗？
然而，现实中我们很难找到这样的事例。正因为如此，经济学者们要运用各种方法，尝试将两个不相似的组转化为“可比较”的组。这些方法将在第2章之后详述。想象不出正确的反事实就会被无稽之谈蒙蔽吗？我想在这里反复强调的是，要明确是否存在因果关系，必须对比事实的结果和反事实的结果。不过遗憾的是，很多人尚未意识到这一点。一般来说，在未能得到正确的反事实时，人们常会把没有
待学习
开始阅读
9
COLUMN 1 巧克力消耗量越大，诺贝尔奖获奖人数越多？
COLUMN 1 巧克力消耗量越大，诺贝尔奖获奖人数越多？巧克力中的黄酮醇能够提高认知功能，这一结论早在动物实验等研究中得到证实。哥伦比亚大学的医师在2012年针对该结论进行数据分析，发现巧克力人均年消耗量越大的国家，诺贝尔奖获奖人数越多。该研究成果被刊登在临床医学界最具权威性的期刊之一《新英格兰医学杂志》上，引发了广泛议论。论文作者得出的结论是：如果平
待学习
开始阅读
10
“实验”能证明因果关系
两个变量的关系属于因果关系还是相关关系？判断这个问题的最可靠方法是“实验”，专业术语称为“随机对照试验”。各位读者朋友可能都听说过“临床试验”。这是为了明确药物疗效与安全性所进行的试验。例如，在小鼠实验中，将生病的小鼠“随机”分成两组，对比给予药物的小鼠（称为干预组）和不给予药物的小鼠（称为对照组）。如果摄入药物的小鼠痊愈率更高，则可认为药物有效。（见图
待学习
开始阅读
11
随机分组的必要性
通过随机对照试验，便可以解答前言中提到的问题：定期接受代谢综合征体检就能长寿吗。这种方法将研究对象人群随机分为两组：接受体检“干预”的组（干预组）和不接受体检的组（对照组）。这里的“干预”意为将原因与结果中相当于“原因”的事项（此处指体检）施加给研究对象人群。为什么一定要进行随机分组？不能直接比较曾经接受过体检和未接受过体检的人吗？其实曾经接受过体检和
待学习
开始阅读
12
“代谢综合征体检”与“长寿”是因果关系吗？
实际上，丹麦曾经进行过调查体检效果的随机对照试验。下面介绍该研究的结果。丹麦也实行与日本类似的代谢综合征体检，为国民提供糖尿病、高血压等生活习惯病的诊断及保健指导服务。随机对照试验将30～60岁的成年男女随机划分为接受体检的干预组（约1.2万人）和不接受体检的对照组（约4.8万人），用了十年时间对两组人群做了追踪调查。① 在干预组中，体检结果为未来患病风险高
待学习
开始阅读
13
何谓“在统计学上具有显著性”？
“干预组和对照组的差异在统计学上不具有显著性”，是指该差异可视为巧合所导致的误差。换句话说，“观测到的差异为偶然产物的概率”低于5%，则该差异可被视为“在统计学上具有显著性”，表示两组的差异属于无法用误差或巧合解释的“具有显著性的差异”；而该概率高于5%时，则该差异“在统计学上不具有显著性”，两组的差异可用误差或巧合来解释。（见图表2-3）5%这个数值本身
待学习
开始阅读
14
定期接受体检并不能带来长寿
丹麦的这项研究显示，接受体检未必就能长寿。不过，这项随机对照试验终归只是在丹麦国内进行的研究。评估体检是否有效是关乎国家整体健康政策的重要问题，仅参考一项随机对照试验的结果做出判断的话，会有很大的风险。因此，下面介绍几项其他国家或地区的随机对照试验的结论。考察多项研究时，可以采用“元分析”（meta-analysis）方法。元分析是指整合多项研究结果，从整体
待学习
开始阅读
15
投入1 200亿日元税金的代谢综合征体检
尽管国外已有可靠证据表明体检不能带来长寿，日本仍在2008年启动了特定健康体检（俗称代谢综合征体检）和特定保健指导服务。众所周知，这项政策的目的在于尽早发现并治疗生活习惯病，所有40岁以上的健康保险参保者都必须接受该体检。从2008年至2014年，日本为这项体检总计投入了大约1 200亿日元税金。斥巨资引入的代谢综合征体检是否见效？为调查体检的效果，厚生
待学习
开始阅读
16
“医疗费用自付比例”和“健康”是因果关系吗？
③ 。 “医疗费用自付比例”和“健康”是因果关系吗？近些年来，医疗费用增加成为日本社会普遍关注的问题。2015年，日本成为世界第三大高医疗费用支出国（占GDP比例），很多人看到这条新闻或许都会感到震惊。医疗费用高涨带来的危机感与日俱增。因此，是否应该提高老年人医疗费用的自付比例成了公众热议的话题。 2017年2月，70岁以下人口的医疗费用自付比例为30%，
待学习
开始阅读
17
兰德健康保险实验的结果
该研究的干预组多达3组，并分别设置了不同的自付比例。分入这三组的研究对象加入研究组②～④的方案，而对照组则是自付比例0%的研究组①。兰德健康保险实验的结果下面来看兰德健康保险实验的结果。首先是各组支出的医疗费用。如图表2-4所示，研究组①（自付比例0%）的医疗费用明显高于其他三组。和研究组④（自付比例95%）相比，高出约为30%。由此可以认为，医疗费用自
待学习
开始阅读
18
除贫困阶层以外，提高自付比例对健康状况没有影响
（数据来源）约瑟夫·纽豪斯等（1993）除贫困阶层以外，提高自付比例对健康状况没有影响上述结果并不值得惊奇。不过，除了这些结论，兰德健康保险实验还证实了医疗费用自付比例与人们的健康状况之间不存在因果关系。在高血压症等30项健康指标上，研究组①（自付比例0%）与研究组②～④之间未发现在统计学上具有显著性的差异。换句话说，这项研究表明，即便医疗费用自付比例
待学习
开始阅读
19
COLUMN 2 整合多项研究的“元分析”
COLUMN 2 整合多项研究的“元分析” 论证某两个变量之间是否存在因果关系的研究未必只有一例。不同研究者围绕同一主题撰写论文的现象非常普遍。有些使用的数据相同，有些使用的数据不同。如果围绕同一主题的所有研究均得出相同的结论，那倒无妨。但有时某篇论文得出的结论是“存在因果关系”，而另一篇的结论是“不存在因果关系”。遇到这种情况，不能认为只有对自己研究有利
待学习
开始阅读
20
用现有数据重现与实验类似的环境
随机对照试验的证据等级很高，但实施过程中会遇到不少困难。比如，可能很难对作为研究对象的个体或企业进行人为随机分组。研究对象可能会强烈反对，或者很多情况下出于伦理考虑，无法进行随机对照实验。让我们用珠宝店的例子设想一下。你所在的珠宝店在全国共有100家店铺。如前文所述，你想明确广告给销售额带来的因果效应。如果可以组织随机对照试验，只需把100家店铺随机分成投
待学习
开始阅读
21
“医生性别”与“患者死亡率”是因果关系吗？
下面介绍一项运用自然实验的研究。走进书店，能看到书架上摆着很多介绍“名医排行”的书籍。翻过这类书的人或许会发现，绝大多数“名医”都是男性。人们似乎大多抱有一种印象，认为名医肯定是男医生。然而，男医生真的比女医生更优秀吗？本书的作者之一津川曾研究过这一课题。他分析了2011年至2014年因内科疾病在美国医院住院的超过100万名患者的数据，试图验证主治医生为男
待学习
开始阅读
22
女医生负责的患者死亡率更低
津川等人的分析结果显示，女医生负责的患者的30天死亡率比男医生的患者低0.4%。（见图表3-1）图表3-1 女医生负责的患者30 天死亡率更低（注）本数据为对患者重症程度、医生特点等因素进行调整后，对就职于同一所医院的男医生和女医生（均为住院医师）进行比较的结果。柱状图顶部的竖线为“95% 置信区间”，表示推测值有95% 的概率属于该区间范围内。更严密地
待学习
开始阅读
23
“出生体重”与“健康”是因果关系吗？
日本有这样一句老话：先生小娃再养大。说的是婴儿出生时体重越轻越好，生下后再把孩子养胖更好。在剖宫产技术尚不成熟的年代，为降低产妇因为生产而死亡的风险，才会出现这句老话。或许是受这种观念的影响，日本的低出生体重儿（出生体重低于2 500克）比例要高于其他国家。（见图表3-2）图表3-2 日本的低出生体重儿多于他国——各国低出生体重儿的比例（注）低出生体重
待学习
开始阅读
24
出生体重较重的婴儿更健康
美国、挪威、加拿大、中国台湾采用大量双胞胎数据展开的研究证实，出生体重较重的婴儿长大后的成绩、学历、收入和健康状况更好。本书作者之一的中室曾利用日本的双胞胎数据进行研究，也发现出生体重较重的孩子初中毕业时的成绩更好。从孩子的角度来考虑，“先生小娃再养大”的建议并不对。近年来，不少经济学研究成果支持“胎儿起源说”。胎儿起源说认为，胎儿时期的发育环境对之后的人
待学习
开始阅读
25
COLUMN 3 被动吸烟会增加心脏病的患病风险吗？
COLUMN 3 被动吸烟会增加心脏病的患病风险吗？日本国立癌症研究中心实施的元分析研究证实了被动吸烟与患肺癌之间确实存在因果关系。不过被动吸烟引发的疾病不只有肺癌。使用阿根廷的数据进行的一项研究表明，被动吸烟与心肌梗死之间也存在因果关系。自2005年世界卫生组织（WHO）批准《烟草控制框架公约》以来，阿根廷迅速加强了对烟草的控制。然而，随着阿根廷地方分
待学习
开始阅读
26
模仿实验的“准实验”
自然实验是利用观测数据和外生冲击，找到类似随机对照试验的环境。然而，日常生活中很少出现法律制度变更、自然灾害等外生冲击，很难找到可视为自然实验的环境。在这种情况下，我们应该怎么做呢？本章开始介绍“准实验”。准实验是对实验的“模仿”，即通过观测数据和统计学方法，打造出与实施随机对照试验相类似的状态。关于这里所说的“统计学方法”，本书将介绍以下4种。双重差分
待学习
开始阅读
27
前后比较毫无意义
让我们回到珠宝店的例子。你所在的珠宝店在2014年圣诞节期间没有投放广告，当年12月的销售额为1 000万日元；而2015年的圣诞季商战中大规模投放了报纸广告，当年12月的销售额是1 400万日元。减去投放广告所花费的100万日元，2015年12月的销售额比上一年同期增长了300万日元。（见图表4-1）图表4-1 通过前后比较，能推算出广告的效果吗？我
待学习
开始阅读
28
不能使用实验前后测分析的两个原因
为什么不能使用实验前后测分析？原因有二。第一，这种方法没能考虑到随时间产生的自然变化（“趋势”）所造成的影响。以珠宝店为例，2015年销售额增长也许只是因为当年经济形势更好，即使不投放广告或许也能卖出1 400万日元。“趋势”的形成与投放广告与否无关，但实验前后测分析容易将其误视为广告的效果。第二，是“回归平均”的可能性。这是一种统计学现象，在不断收集数据
待学习
开始阅读
29
去年的销售额为“反事实”时，前后比较才有效
不过，实验前后测设计在一些特殊案例中也可以使用。我们继续思考图表4-1的事例。要证明2014年和2015年的销售额之差（400万日元）是广告的因果效应，必须满足一个条件，即2015年如果没有投放广告，就会实现和2014年完全相同的销售额。换句话说，2014年的销售额必须可以代表“如果2015年未投放广告”的反事实。（见图表4-2）图表4-2 可以使用实
待学习
开始阅读
30
实验前后测设计的改良版——双重差分法
“双重差分法”是实验前后测设计的改良版。它与实验前后测设计不同之处在于，双重差分法需要代表反事实的“对照组”。要采用双重差分法，必须分别获取干预组与对照组在实验前后两个时点的数据。顾名思义，这种方法需要两个“差异”数据。一个是干预前后的“差异”（与实验前后测设计推算的效果相同）；另一个则是干预组与对照组的“差异”。这种方法用两个“差异”的差异来推算干预的效
待学习
开始阅读
31
双重差分法成立的两个前提条件
双重差分法成立必须满足两个前提条件。第一，“干预组和对照组在投放广告之前的销售额趋势平行”。B地区店铺的销售额代表了A地区店铺如果未投放广告时的反事实状态。因此，A地区店铺和B地区店铺至少在干预前必须为“可比较”的组。换句话说，A地区和B地区在投放广告之前的销售额必须具有相同的“趋势”（图表4-8中体现的倾斜程度）。图表4-8 双重差分法的前提条件不过
待学习
开始阅读
32
“保育所数量”与“母亲就业”是因果关系吗？
下面介绍一项应用双重差分法的研究。 “没上成保育园，日本去死！”这句话登上了2016年日本U-CAN新语及流行语大奖的候选名单。因孩子上不成保育园① 而不得不辞去工作的母亲的这句肺腑之言使日本社会意识到保育园入园难问题的严重性。这句话引发的关注也促使政府制定了紧急措施，放宽了针对保育园的规定。然而，增设认可保育所真的能促进母亲就业吗？这个问题还有待慎重探讨
待学习
开始阅读
33
增设认可保育所不会提升母亲的就业率
对这个问题，我们也需要认真思考保育园与母亲就业的关系属于因果关系还是相关关系。究竟是“因为有保育园，所以母亲去就业”（因果关系），还是“母亲就业率高的地区保育园数量也多”（相关关系）？增设认可保育所不会提升母亲的就业率东京大学的朝井友纪子、一桥大学的神林龙和麦克马斯特大学的山口慎太郎针对这一问题展开了研究。他们采用1990年到2010年间日本各行政区的保
待学习
开始阅读
34
“最低工资”与“就业”是因果关系吗？
这篇论文的作者之一山口指出，即使增设认可保育所并不会对母亲就业产生因果效应，但保育园是由拥有专业知识和技能的保育员所组成的专业组织，可能对儿童的成长和健康产生更多的积极影响。实际上，以往很多经济学研究已证实，优质幼儿教育的投资回报率极高。从这个角度来看，或许正如山口所言，增设认可保育所的目的与其说是促进母亲就业，不如定位为为孩子开拓更好的未来更恰当。 “最低
待学习
开始阅读
35
提高最低工资不会减少就业
这项研究中的第一个差异是1992年前后两个州的就业率差异，第二个差异是新泽西州（干预组）和宾夕法尼亚州（对照组）的就业率差异。二人试图通过这两个“差异”推算出提高最低工资对就业的因果效应。提高最低工资不会减少就业卡德和克鲁格的分析发现，提高最低工资不会减少就业。③ 此外还发现，提高最低工资导致了新泽西州企业提高了产品价格。也就是说，企业并未通过裁员来克服
待学习
开始阅读
36
COLUMN 4 “不快点睡觉，妖怪就要来了”是正确的教育方法吗？
COLUMN 4 “不快点睡觉，妖怪就要来了”是正确的教育方法吗？美国有一种名为“恐吓从善”（scared straight）的教育方法。通过恐吓让孩子认识到遵守规矩的必要性。例如通过重现交通事故现场让孩子学习遵守交通法规的重要性，或者带不良少年参观监狱以促使他们改过自新。日本也有一些父母会为了督促孩子睡觉，跟孩子说“不快点睡觉，妖怪就要来了”。看来“恐
待学习
开始阅读
37
广告费打折，该怎样利用
本章将介绍“工具变量法”。让我们再回到珠宝店的事例。你想评估广告对销售额有没有因果效应。安排下属调查后，遗憾地发现投放广告的店铺和不投放广告的店铺很难被视为可比较的组。因为投放广告与否很大程度上是由各店铺的店长决定的，投放广告的店铺与不投放广告的店铺相比，店长的干劲可谓天差地别。这种情况下，广告与销售额之间可能实际上不存在因果关系，但“店长的干劲”这个混杂
待学习
开始阅读
38
工具变量法成立的两个前提条件
工具变量需要满足两个条件。第一，工具变量要能够影响原因，但不直接影响结果。来看图表5-2。图中箭头表示原因与结果之间的因果关系，如“原因→结果”。箭头表示两者之间存在因果关系，其起点是原因，终点是结果。图表5-2 第三变量可作为工具变量的条件（1）此时，要使工具变量成立，必须满足的条件是：“工具变量→原因”成立，且“工具变量→结果”不成立。第二个条件如
待学习
开始阅读
39
“看电视”与“学习能力”是因果关系吗？
下面就来介绍一项应用了工具变量的研究。不少家长担心孩子看电视时间过长。日本厚生劳动省的统计显示，小学六年级学生周一到周五每天约有2.2小时、周末每天约有2.4小时在电视机前度过。花这么多时间看电视，父母担心也在所难免。很多人坚信电视会对孩子的成长、健康以及学习能力带来不良影响。美国俗语甚至把电视称作“傻瓜盒子”（idiot box）。不过，看电视真的会
待学习
开始阅读
40
看电视可以提高偏差值
根茨科等人的分析结果出人意料：20世纪40年代至50年代前期，年幼时经常看电视的孩子在升入小学后的学力测试中，偏差值高出0.02。此外，也没有发现看电视对做作业的时间、升学志愿等方面产生不良影响。分析还指出，在英语不是母语，或者母亲学历较低，或者非白人人种的孩子当中，看电视还对成绩提高产生了显著效果。根茨科等人认为，很多家长之所以不愿意让孩子看电视，或许是
待学习
开始阅读
41
“母亲的学历”与“孩子的健康”是因果关系吗？
哥伦比亚大学的珍妮特·克里（Janet Currie）等人的研究也应用了工具变量法。经济学家克里曾通过多项研究证实幼年时孩子的健康状况会对长大后的学历及收入产生显著影响。而她接下来试图论证的是“幼年时孩子的健康状况取决于什么”。克里认为母亲学历高或许会对孩子的健康状况产生积极影响，于是采用美国两百多万名母亲的数据进行了研究。母亲学历高真的对孩子健康状况有
待学习
开始阅读
42
母亲上过大学，孩子更健康
克里等人的研究显示，本科以上高学历的母亲生育早产儿或低出生体重儿的概率更低，婴儿出生时的健康状况更好。究其原因，本科以上高学历母亲在怀孕期间吸烟的概率较低，接受产检的概率也更高。也就是说，上大学使她们养成了利于孩子健康的好习惯。克里等人的研究让人们关注到教育带来的好处。芝加哥大学的迈克尔·格林斯通（Michael Greenstone）等人通过研究发现，股
待学习
开始阅读
43
COLUMN 5 增加女性管理层成员能促进企业成长吗？
COLUMN 5 增加女性管理层成员能促进企业成长吗？ 2016年，安倍内阁出台“女性活跃推进法”。这项法案作为成长战略的一环，为女性管理者的比例设置了数据目标。按照这个规定，企业和地方政府必须制订并公开实现女性管理者比例目标的行动计划。某项调查结果显示，女性董事人数较多的企业业绩更好（图表5-4），至于二者之间是因果关系还是相关关系，还有待更严谨的论证。
待学习
开始阅读
44
利用“49人店铺”与“50人店铺”的差异
本章将介绍“断点回归设计”。让我们继续以珠宝店为例。就职于珠宝店的你还在为如何论证广告的效果而一筹莫展。这时，下属向你提出了一个方案：只有员工人数50人以上（含50人）的大型店铺才在年底圣诞季商战期间投放广告。对此，你产生了一个想法：按照这个方案，员工人数49人的店铺不投放广告，而50人的店铺投放广告。不过，49人的店铺和50人的店铺除了是否投放广告之外，
待学习
开始阅读
45
断点回归设计成立的前提条件
用断点回归设计推算因果效应，必须满足一个重要的前提条件：在连续变量的断点附近，没有发生过影响结果的其他事件。比如，假设员工人数50人以上（含50人）的店铺不仅可以投放广告，还会根据销售额发放奖金。在这种情况下，就无法判断断点的“跳跃”是广告的效果还是奖金的效果了。
待学习
开始阅读
46
“朋友的学力”与“自己的学力”是因果关系吗？
下面介绍几项应用断点回归设计的研究成果。每当备考季节临近，总有不少家长祈祷自家孩子能够超常发挥，考入偏差值高的学校。他们可能认为在偏差值高的学校就读的肯定都是学习能力强的学生，即使自家孩子的实力可能稍有不足，但能和学霸朋友们一起学习，孩子的学习能力自然也会随之提高。可能正因为他们的这种想法，“学生学习能力高”的学校附近房价和地价才会连年攀升吧。经济学领域将
待学习
开始阅读
47
和学霸在一起，也无法提高自己的学习能力
安格瑞斯特等人的研究结果显示，在波士顿和纽约的所有学校，断点前后并未观测到学习能力的“跳跃”现象。关于“同群效应”是否存在尚无定论，但也有不少探讨和学习能力强的人做朋友对学习能力的因果效应的研究得出了和安格瑞斯特等人相同的结论。例如，美国全国经济研究局（NBER）的杰弗里·克林（Jeffrey R. Kling）等人对美国政府实施的一项大型随机对照试验“
待学习
开始阅读
48
“医疗费用自付比例”与“死亡率”是因果关系吗？
再来介绍一项应用了断点回归设计的研究。在第2章中，我们探讨了医疗费用自付比例的问题。一些观点建议通过提高自付比例来控制医疗费用的增加，也有人担忧这样做会迫使老年人减少就医次数，对其健康状况造成不利影响。针对这个课题，加拿大西蒙弗雷泽大学的重冈仁利用日本的数据进行了研究。重冈着眼于日本老年人在年满70岁以后医疗费用自付比例从30%降至10%的制度，将70岁作
待学习
开始阅读
49
提高老年人医疗费用的自付比例对死亡率没有影响
第2章介绍的兰德健康保险实验（参考正文第36页）得出的结论是，提高自付比例对健康状况没有影响。然而在美国，由于人们年满65岁就会自动加入国家公共医疗保险（联邦医疗保险，Medicare），所以兰德健康保险实验中未包括65岁以上的老年人。重冈这项研究的卓越之处在于，对兰德健康保险实验未能覆盖到的老年人群体自付比例与健康和死亡率之间的因果关系做了论证。提高老年
待学习
开始阅读
50
COLUMN 6 “激素替代疗法”的陷阱
COLUMN 6 “激素替代疗法”的陷阱前面曾提到随机对照试验的证据等级比较高。下面就来介绍一项研究，它用随机对照试验完全逆转了用观测数据得出的结论，也因此而让“激素替代疗法”受到了广泛关注。众所周知，女性患心肌梗死等动脉硬化导致的疾病的风险要低于男性。但女性绝经后，患心肌梗死的概率会增至和男性同等的水平。因此有假说推测是雌激素降低了动脉硬化的风险。于
待学习
开始阅读
51
找出相似的店铺
本章介绍最后一种准实验方法——“匹配法”。我们依旧用珠宝店的事例来思考。假设你还在为投放广告的店铺和不投放广告的店铺不可比较一事发愁。这时，你突然产生了一个想法。你所在的珠宝店目前共有100家店铺。其中30家投放了广告，70家未投放广告。从未投放广告的70家店铺中，选出和投放广告的30家店铺情况相似的30家店铺，将二者进行比较不就好了吗？这便是匹配法的思路
待学习
开始阅读
52
整合多个协变量的“倾向得分匹配法”
图表7-1 找出相似个体的“匹配法” 整合多个协变量的“倾向得分匹配法” 协变量未必只有一个。如果只考虑店长年龄相同的店铺，那么从对照组中找到符合这个条件的店铺进行匹配并不难。然而，如果存在多个协变量，恐怕就不一定能从对照组中找到所有条件都完全一样的店铺了。这种情况下，我们可以使用匹配法中的“倾向得分匹配法”（Propensity Score Matchi
待学习
开始阅读
53
倾向得分匹配法成立的前提条件
达到了这个状态，我们才可以说构造出了两个可比较组：考虑多种属性，两家店铺投放广告的可能性相同，只是碰巧其中一家投放了广告，而另一家没投放广告。也就是说，这种情况下，对照组才能代表“如果干预组没有投放广告”的反事实，我们也才能明确干预组和对照组的销售额差异200万日元（1 200万日元-1 000万日元）是广告带来的因果效应。倾向得分匹配法成立的前提条件倾
待学习
开始阅读
54
“大学偏差值”与“收入”是因果关系吗？
第二个前提条件是所有协变量都必须用来计算倾向得分。 “大学偏差值”与“收入”是因果关系吗？下面介绍普林斯顿大学的克鲁格等人撰写的两篇论文，是运用匹配法进行的出色研究。日本被称为学历社会，但即使都是大学毕业生，之后的人生也并不会相同。一桥大学的神林龙等人的研究显示，20世纪90年代大学毕业生和高中毕业生的工资差距并未拉大，但大学毕业生之间的工资差距却有所增
待学习
开始阅读
55
上偏差值高的大学，收入也不会增长
然后比较二人考上的两所大学，大学A的偏差值要比大学B更高。假设其中一人选择就读大学A，而另一人选择了专业对自己更有吸引力的位于当地的大学B。那么只要对这两个人进行比较，就能推算出就读偏差值高的大学对未来收入的因果效应。上偏差值高的大学，收入也不会增长匹配法的分析结果出乎意料。在考上某大学且就读于该大学的学生组（干预组）和同样考上该大学但最终选择了偏差值较
待学习
开始阅读
56
COLUMN 7 商务版随机对照试验“A/B测试”
COLUMN 7 商务版随机对照试验“A/B测试” 随机对照试验在商业领域也逐渐得到了广泛应用。“A/B测试”就属于这种情况。让我们再回到珠宝店的事例。热销产品的首饰盒现有两款候选设计A和B，你在犹豫应该选用哪一款。一名销售员断定设计A更符合公司的风格，另一名销售员则说其他公司的畅销产品都与设计B很像。即使选择了设计A的首饰盒，可能你也会情不自禁地想象反事
待学习
开始阅读
57
假如现有数据都不适合用来评估因果关系……
就职于珠宝店的你盯着面前的数据。公司在一本半年前创刊的杂志上投放广告，今天你收到了投放广告后的销售数据。领导让你根据这些数据分析下一季度是否应该继续在该杂志上投放广告。然而遗憾的是，该杂志创刊没多久，无法用断点回归法、双重差分法等准实验方法进行分析。当然，运用随机对照试验或准实验进行分析，正确评估因果效应的可能性会更大。然而，在实际工作和生活中，绝大部分数
待学习
开始阅读
58
画一条表示数据的“回归线”
下面先用一元回归分析介绍回归分析的基本概念。假设有4个数据如图表8-1所示，每个数据都代表一种原因与结果的组合。你希望能确定这两个变量之间是否存在因果关系。所谓回归分析，就是在这4个点之间画出一条“回归线”。如果能画出回归线，这条线的“倾斜程度”就代表了每增加一个单位的原因会给结果带来的变化。也就是说，回归线的倾斜程度便是原因对结果的“因果效应”。下面讲
待学习
开始阅读
59
用“多元回归分析”排除混杂因素的影响
如果想在一元回归分析中用回归线的倾斜程度代表因果效应，必须满足“不存在混杂因素”的前提条件。然而，现实中很少有情况符合这个条件。多元回归分析则可以排除混杂因素的影响。多元回归分析使混杂因素的值保持固定不变① ，以便我们能够画出表示原因与结果的关系的“回归线”，并根据回归线的倾斜程度来评估因果效应。下面我们以饮酒与肺癌的关系为例进行说明。假设我们现在怀疑饮酒
待学习
开始阅读
60
COLUMN 8 因果推理的发展史
经济学及统计学领域的因果推理因果推理在经济学领域的历史其实并不长。20世纪40年代，挪威奥斯陆大学的经济学者特里夫·哈维默（Trygve Magnus Haavelmo）在论文中使用了与反事实概念相类似的表述，但这一表述从严格意义上来说还算不上对反事实的准确定义。进入20世纪90年代后，出现了一些较大变化。当时哈佛大学经济学院的著名计量经济学家吉多·因本
待学习
开始阅读
61
内部效度与外部效度
以上我们学习了因果推理的多种方法。在这个补论中，我们将介绍一下这些方法的“有效性”与“局限性”。先来解释两个用来评价分析结果有效性的概念：“内部效度”和“外部效度”。所谓内部效度，是指两个变量之间的因果关系的确定程度，即对研究对象群体再次施加相同干预后，会出现相同结果的程度；而外部效度则指对研究对象之外的群体施加相同干预后，会出现相同结果的程度。我们来思
待学习
开始阅读
62
随机对照试验也有局限性
正如前面提到的，本书介绍的各种方法虽然都是学术上成立的方法，但并非完美无缺。我们只有了解每种方法的局限性，对所得结果的有效性进行充分的探讨，才能得出“两个变量之间是否存在因果关系”这一问题的准确答案。本书虽然也介绍了多种利用自然实验或准实验根据观测数据判断因果关系的方法，不过就判断因果关系这一点而言，随机对照试验毫无疑问要优于利用观测数据进行的研究。不过，
待学习
开始阅读
63
补论2 因果推理的五个步骤
随机对照试验随机对照试验通过投硬币、随机数表、抽签等方式，将研究对象人群随机分为接受干预的组（干预组）和不接受干预的组（对照组），使两组成为可比较的组，用对照组的数据替换干预组“如果没有受到干预”的反事实。 COLUMN 2 整合多项研究的“元分析” 论证某两个变量之间是否存在因果关系的研究未必只有一例。不同研究者围绕同一主题撰写论文的现象非常普遍。有些使
待学习
开始阅读
64
后记
第3章男医生比女医生更优秀吗？利用与实验类似的偶发现象进行自然实验用现有数据重现与实验类似的环境随机对照试验的证据等级很高，但实施过程中会遇到不少困难。比如，可能很难对作为研究对象的个体或企业进行人为随机分组。研究对象可能会强烈反对，或者很多情况下出于伦理考虑，无法进行随机对照实验。让我们用珠宝店的例子设想一下。你所在的珠宝店在全国共有100家店铺
待学习
开始阅读
65
参考文献
也许有人会想双胞胎的体重也存在差异吗？一般而言在母体中营养状况相对更好的胎儿体重会更重，也会先出生。当然，双胞胎的出生顺序是偶然的，他们自然分为体重较重的婴儿和体重较轻的婴儿也可看作一种自然实验。出生体重较重的婴儿更健康美国、挪威、加拿大、中国台湾采用大量双胞胎数据展开的研究证实，出生体重较重的婴儿长大后的成绩、学历、收入和健康状况更好。本书作者之一的中
待学习
开始阅读

Reader

章节阅读

Local EPUB Text

整合多个协变量的“倾向得分匹配法”

图表7-1　找出相似个体的“匹配法”

整合多个协变量的“倾向得分匹配法”

协变量未必只有一个。如果只考虑店长年龄相同的店铺，那么从对照组中找到符合这个条件的店铺进行匹配并不难。然而，如果存在多个协变量，恐怕就不一定能从对照组中找到所有条件都完全一样的店铺了。

这种情况下，我们可以使用匹配法中的“倾向得分匹配法”（Propensity Score Matching）。“倾向得分匹配法”将多个协变量整合成一个得分，用这个得分进行匹配。倾向得分指 “分入干预组的概率”。例如，考虑多个协变量后，如果某店铺投放广告的概率为50%，则该店铺的倾向得分就是0.5；如果某店铺投放广告的概率为30%，则该店铺的倾向得分为0.3。

如果投放广告的店铺（干预组）中有某店铺倾向得分为0.5，那么就从未投放广告的店铺（对照组）中选出倾向得分同为0.5的店铺进行匹配；如果某店铺倾向得分为0.3，那么就从对照组选出得分同为0.3的店铺进行匹配。对采用这种方法最终形成的两个组进行比较，可以发现用于计算倾向得分的所有协变量（平均之后）在两个组具有相同的值。

为了便于读者理解倾向得分匹配法的整体概念，下面就用笔者自制的数据来推算广告对销售额的因果效应。假设影响销售额的因素包括店长年龄、店铺所在地区的人口以及店铺所在地区的人均收入（“店长年龄”“地区人口”和“地区人均收入”等3个变量为协变量）。

来看图表7-2。如果只看这一张表，似乎不投放广告的店铺的销售额反而更高。不过事实是否真是这样呢？你所在的珠宝店不应该投放广告吗？

图表7-2　无法对“协变量”各不相同的两个组进行比较

显然，投放广告的干预组和未投放广告的对照组不是可比较组。投放广告的店铺店长年龄比较大，也许是公司特意把经验丰富的店长派到了销售额较低的地区。如果单纯从有无投放广告的角度对销售额进行比较，很可能得出广告对销售额具有负面效果的错误结论。

这种情况就正好可以用到倾向得分匹配法。用店长年龄、地区人口、地区人均收入这三个协变量计算出倾向得分。然后，从干预组和对照组中依次找到倾向得分相近的店铺进行匹配。这样便可以得到干预组的30家店铺和对照组的30家店铺。

来看图表7-3。这是进行倾向得分匹配后的干预组和对照组的对比。匹配之后，只要协变量的分布一致（经济学家们将这种现象称为“协变量达到平衡”），我们就可以说这两个组是可比较的。

图表7-3　利用倾向得分匹配法使“协变量”达到平衡