Local EPUB Text
后 记
第3章 男医生比女医生更优秀吗?
利用与实验类似的偶发现象进行自然实验
用现有数据重现与实验类似的环境
随机对照试验的证据等级很高,但实施过程中会遇到不少困难。比如,可能很难对作为研究对象的个体或企业进行人为随机分组。研究对象可能会强烈反对,或者很多情况下出于伦理考虑,无法进行随机对照实验。
让我们用珠宝店的例子设想一下。你所在的珠宝店在全国共有100家店铺。如前文所述,你想明确广告给销售额带来的因果效应。如果可以组织随机对照试验,只需把100家店铺随机分成投放广告的店铺(干预组)和不投放广告的店铺(对照组),进行比较即可。然而实际上这恐怕不会这么轻易实现。
被分入不投放广告组的店铺可能会有意见,在重视速度的销售最前线,恐怕也没有充足的时间等待随机对照试验的结果出来之后再做决定。
再者,如今已是大数据时代。对很多情况,我们手头已经掌握了各种各样的数据。如果对这些数据视而不见,只会感叹“不做随机对照试验,就无法测定广告效果”,这样的人实在称不上有能力的企业人。
无法实施随机对照试验等人为实验时,我们只能用手头现有的数据进行分析。通过随机对照试验得到的数据称为“实验数据”,通过日常经济活动得到的数据以及从政府统计调查等渠道获得的数据称为“观测数据”。
采用观测数据进行分析时,首要工作是从观测数据中找出“与人为实验相类似”的环境。本章介绍的“自然实验”,便是通过法律或制度变化、自然灾害、战乱等人们无法预测的变化,找到与随机对照试验类似的环境,从而明确两个变量之间的因果关系。
此处重申,这种方法的目的同样也是“制造可比较的组,用最贴切的值替换反事实”。事先无法预测的某些因素(经济学称其为“外生冲击”)可以在不经意中将研究对象自然而然地划分为干预组和对照组,自然实验就是要利用这种环境。根据研究内容的不同,可以利用的外生冲击包括制度变革、自然灾害等。
那么回到上面的例子,考虑到实施随机对照试验的难度,你决定为所有的100家店铺统一投放报纸折页广告。可是,负责印刷广告的某家企业印刷机出现故障,导致部分店铺未能投放广告。
于是你想到了一个主意:利用这种情况,对如期投放广告的店铺和未能投放广告的店铺进行比较,是不是就能评估出广告给销售额带来的因果效应呢?实际上,这正是自然实验的思维方式。
“医生性别”与“患者死亡率”是因果关系吗?
下面介绍一项运用自然实验的研究。走进书店,能看到书架上摆着很多介绍“名医排行”的书籍。翻过这类书的人或许会发现,绝大多数“名医”都是男性。人们似乎大多抱有一种印象,认为名医肯定是男医生。然而,男医生真的比女医生更优秀吗?
本书的作者之一津川曾研究过这一课题。他分析了2011年至2014年因内科疾病在美国医院住院的超过100万名患者的数据,试图验证主治医生为男性的情况下和主治医生为女性的情况下,患者住院后30天之内死亡的概率(30天死亡率)有无差异。
思考这个问题时必须注意一点:男医生或许更倾向于选择重症患者,或者重症患者更倾向于选择男医师做自己的主治医生。为排除这类选择性偏差的干扰,津川等人选择针对住院医师(hospitalist)进行研究。
住院医师指不对外坐诊、只负责治疗住院患者的内科医生。这类专业医生自20世纪90年代起在美国得到飞速发展,如今绝大多数大型医院的内科住院患者都由住院医师负责治疗。住院医师的工作通常为轮班制,主要负责自己当班时收治的患者。也就是说,住院医师无法选择自己负责哪些患者,而患者也不能选择自己的主治医生。这种情况正可谓将患者随机分配到男医生组或女医生组的自然实验。
女医生负责的患者死亡率更低
津川等人的分析结果显示,女医生负责的患者的30天死亡率比男医生的患者低0.4%。(见图表3-1)
图表3-1 女医生负责的患者30 天死亡率更低
(注)本数据为对患者重症程度、医生特点等因素进行调整后,对就职于同一所医院的男医生和女医生(均为住院医师)进行比较的结果。柱状图顶部的竖线为“95% 置信区间”,表示推测值有95% 的概率属于该区间范围内。更严密地说,95% 置信区间的定义是:将同一研究重复进行100 次,每次均构造出95% 置信区间,其中有95 次的置信区间会包含真值。
(数据来源)摘自津川等(2017),对部分内容稍做了调整。
也许有人觉得0.4%的差异很小,几乎可以忽略不计。但其实这个差异绝对不小。死亡率0.4%的差异和近十年美国通过各种努力才实现的住院患者死亡率的下降幅度几乎持平。美国通过研发新药和医疗器械、开展医学研究获得最新知识、完善临床指南等途径实现的死亡率降幅和男女医生负责患者的死亡率之差相当,这个事实足以让人震惊。
为什么女医生负责的患者死亡率更低?既往研究发现,女医生遵照临床指南进行治疗的比例更高,她们和患者之间的交流也更为密切。有可能是男女医生在治疗方法上的差异导致了患者预后的差异。①
在美国,与男医生相比,女医生薪酬更低,晋升所需年数更多,这已经上升为社会问题。从该研究中也可以发现,女医生提供的治疗质量高于男医生。因此,在医疗领域,也需要消除性别带来的差距。
“出生体重”与“健康”是因果关系吗?
日本有这样一句老话:先生小娃再养大。说的是婴儿出生时体重越轻越好,生下后再把孩子养胖更好。在剖宫产技术尚不成熟的年代,为降低产妇因为生产而死亡的风险,才会出现这句老话。
或许是受这种观念的影响,日本的低出生体重儿(出生体重低于2 500克)比例要高于其他国家。(见图表3-2)
图表3-2 日本的低出生体重儿多于他国——各国低出生体重儿的比例
(注)低出生体重儿的定义为出生体重低于2 500 克的婴儿(2011 年)。
(数据来源)OECD Health Statistics 2016
低体重对婴儿真的没有影响吗?一项经济学研究运用双胞胎的数据探讨了这个问题,其方法是对双胞胎中出生体重较重的婴儿(干预组)和出生体重较轻的婴儿(对照组)进行比较。