学习进度

0%

阅读时长

未满 1 分钟

最近阅读:未开始阅读

核心概念

待提炼

章节学习

  • 1

    献词

    献给诺加、奥里和吉利 ——丹尼尔·卡尼曼 献给范丁和莱莉亚 ——奥利维耶·西博尼 献给萨曼莎 ——卡斯·R.桑斯坦

    待学习
    开始阅读
  • 2

    重磅赞誉

    从“偏差”到“噪声”,作为心理学家的卡尼曼,挑战的是经济学的“理性人”假设,并因开启了行为经济学的大门而获得诺贝尔经济学奖。他一直关注的是人类在决策中是如何犯错的,在这本书中,他深入分析了噪声的影响,但也乐观地预期,可以通过发掘埋没在大数据中的信息来减少决策中的噪声,这可以说是大数据渗透到行为经济学领域的新趋势。 巴曙松 北京大学汇丰金融研究院执行院长,中国

    待学习
    开始阅读
  • 3

    测一测 如何做一个聪明的决策者?

    测一测 如何做一个聪明的决策者? 想知道你的判断 是怎么掉入噪声陷阱的吗? 扫码测一测, 立即获取答案及解析, 看看你的“降噪等级”。 1.卡尼曼是世界上第一个凭借心理学研究获得诺贝尔经济学奖的人。这个说法对吗? A.对 B.不对 2.卡尼曼指出:人类判断出错的原因有两种。一种是偏差,另一种是什么呢? A.误差 B.噪声 C.系统认知 3.在做一个判断时,以

    待学习
    开始阅读
  • 4

    推荐序1 在无法回避噪声的世界,更好地追求高级境界与极致效益

    推荐序1 Preface 在无法回避噪声的世界, 更好地追求高级境界与极致效益 彭凯平 清华大学社会科学学院院长 每年七八月份,我都会参加清华大学的本科生招生工作,由此而目睹了一个问题:高考揭榜之后,高中毕业生及其家长应如何做好志愿填报?学校和专业的选择非常重要,很有可能会决定一个学生一辈子的命运,其中牵涉的问题就与我们心理学中一个重要的研究领域紧密相关,那

    待学习
    开始阅读
  • 5

    推荐序2 穿越噪声的决策

    推荐序2 Preface 穿越噪声的决策 朱宁 上海交通大学上海高级金融学院金融学教授,副院长 我抱着浓厚的兴趣读完了诺贝尔经济学奖得主丹尼尔·卡尼曼教授等的新作《噪声》一书,这本书汇集了卡尼曼教授近十年的最新发现。对于我所从事的行为金融学研究领域而言,《噪声》算得上是一本“专业书”,但是读完之后,我认为它很可能是卡尼曼教授继《思考,快与慢》后,又一次成功将

    待学习
    开始阅读
  • 6

    中文版序 哪里有判断,哪里就有噪声

    中文版序 Preface 哪里有判断,哪里就有噪声 我们非常荣幸,也非常感激,能够在中国出版这本书。《噪声》重点关注人类的判断,关注它是如何出错的,以及如何让它变得更好。无论是医学、法律、公共政策、商业,还是日常生活领域中,我们做出判断的过程中存在的问题,是偏好根据经验做判断的人类的共性问题。 数十年来,偏差问题备受瞩目。在《思考,快与慢》一书中,本书的作者

    待学习
    开始阅读
  • 7

    引言 偏差与噪声,人类判断的两类错误

    引言 Introduction 偏差与噪声,人类判断的两类错误 试想一下,你的朋友组成了A、B、C、D共4支队伍,来到一个射击场。每队中有5个人,他们共用一支来复枪,且每人只开了一枪。图0-1显示了他们的射击结果。 图0-1 4支队伍的射击结果 理想情况是,每一枪都能正中靶心。 A队几乎达到了理想情况,他们的每一发子弹都紧紧围绕着靶心,接近完美模式。 B队的

    待学习
    开始阅读
  • 8

    第1章 犯罪和充满噪声的判罚

    第1章 犯罪和充满噪声的判罚 假设某人被指控犯了罪,例如到商店行窃、私藏海洛因、袭击他人或持枪抢劫,该案件可能的判决结果是什么? 答案不应取决于该案件恰巧被指派给哪位法官、天气是冷是热,以及当地球队在前一天是输是赢。如果3个背景类似的人被指控犯有同一罪行,最后却得到截然不同的处罚,例如第一个人被判缓刑,第二个人被判2年有期徒刑,最后一个人被判10年有期徒刑,

    待学习
    开始阅读
  • 9

    第2章 系统噪声,给人达成一致的错觉

    第2章 系统噪声,给人达成一致的错觉 我们最初接触噪声,并对这个主题产生兴趣,并不是因为遇到了像刑事司法案件那般富有戏剧性的案例。实际上,这次邂逅纯属偶然,缘于一家保险公司,这家公司与我们中的两人所属的咨询公司有合作。我们的研究揭示了营利性组织中存在噪声问题的严重性——组织会因为决策中的噪声损失惨重。我们在保险公司的经历有助于解释为什么噪声问题常常被忽视,以

    待学习
    开始阅读
  • 10

    第3章 单一决策,仅发生一次的重复决策

    第3章 单一决策,仅发生一次的重复决策 到目前为止,我们所讨论的案例研究都与重复决策相关。比如,对盗窃犯的恰当判决是什么?对某一特定风险该收取多少保费?虽然每个具体的案例在某种意义上都是独特的,但像这样的判断属于重复决策。医生诊断患者,法官审理假释案件,招生人员审查入学申请书,会计师准备税单等,这些都是重复决策。 正如前一章所介绍的,重复决策中的噪声可以通过

    待学习
    开始阅读
  • 11

    第4章 什么是判断

    第4章 什么是判断 本书论述的是一般意义上的专业判断,我们假设如果做判断的人有足够的能力,就能做出准确的判断。然而,判断这一概念本身包含着一个你不得不承认的事实:你永远无法确定一个判断是不是准确。 请思考“判断问题”和“主观判断”这两个短语的差别。我们认为“太阳明天会升起”或“NaCl是氯化钠的化学式”这样的陈述并非判断,因为任何理性的人都会完全同意上述观点

    待学习
    开始阅读
  • 12

    第5章 测量误差,噪声与偏差的代价一样大

    第5章 测量误差,噪声与偏差的代价一样大 显而易见的是,一致性的偏差会引发代价高昂的错误。如果体重秤在你每次称体重时都自动加上一定的重量,如果一位乐观的经理总是预测项目只需花费实际所需时间的一半,如果一位谨小慎微的经理总是年复一年地低估未来的销售额,那么后果都将会非常严重。 我们已经知道,噪声会引发代价高昂的错误。如果一位经理大多数时候预测的项目所需时间只是

    待学习
    开始阅读
  • 13

    第6章 噪声分析:所有判断都存在3类噪声

    第6章 噪声分析:所有判断都存在3类噪声 在上一章,我们讨论了单个案例中测量或判断的变异性。在单个案例中,判断的所有变异性都是误差,而误差由偏差和噪声组成。我们考察的判断系统,包括法院和保险公司的判断系统,它们的目的在于处理不同案例,并对这些案例进行区分。如果美国的联邦法官和保险理赔员对他们手头的所有案例都做出相同的判断,那他们就没有什么存在的价值了。对不同

    待学习
    开始阅读
  • 14

    第7章 情境噪声,无时无刻不在影响着我们的判断

    第7章 情境噪声,无时无刻不在影响着我们的判断 想象一名职业篮球运动员正在准备罚球的场景:他站在罚球线上,全神贯注地准备投篮。这是他练习过无数次的一系列动作,他能投中吗?我们无法预知结果。 在NBA的比赛中,球员们通常能够4罚3中。显然,一些球员比其他球员表现得更好,但没有人能做到百发百中(3)。虽然篮筐一直都是距离地面3.05米,与罚球线的垂直距离一直是4

    待学习
    开始阅读
  • 15

    第8章 群体是如何放大噪声的

    第8章 群体是如何放大噪声的 个体判断中存在噪声的结果已经很糟糕了,但群体决策中的噪声危害更甚。群体决策可能会由于一些无关因素而朝任何一个方向改变。谁先发言、谁后发言,谁说话更自信,谁穿着黑色衣服,谁和谁挨着坐,谁在某个时刻笑了/皱眉了/呈现出其他身体姿势……所有这些因素都会影响结果。相似的群体每一天都会做出各种不同的决策,如雇用、晋升、破产、沟通策略、环境

    待学习
    开始阅读
  • 16

    第9章 判断与模型,简单的模型普遍优于人类判断

    第9章 判断与模型,简单的模型普遍优于人类判断 很多人都对预测未来的工作绩效感兴趣,不只是自己的,还有别人的。因此,绩效预测是用来考察预测性判断的实用例子。例如,一家大公司在招聘高管时,聘请了一家专业咨询公司对两名候选人莫妮卡和娜塔莉进行评估,并以取值为1~10分的量表对两人的领导力、沟通能力、人际交往能力、职业技能、应聘动机等维度进行打分(见表9-1)。你

    待学习
    开始阅读
  • 17

    第10章 无噪声的规则

    第10章 无噪声的规则 近年来,人工智能(Artificial Intelligence)特别是机器学习技术让机器能够执行许多以前只有人类才能执行的任务。机器学习算法可以承担人脸识别、语言翻译、分析医学影像等任务,并且可以以惊人的速度和准确性来处理计算问题,例如为成千上万名驾驶员迅速规划行车路线。它们还可以执行困难的预测任务:预测美国最高法院的判决;识别哪些

    待学习
    开始阅读
  • 18

    第11章 哪里有预测,哪里就有客观无知

    第11章 哪里有预测,哪里就有客观无知 我们经常同一些公司高管分享第9章和第10章中的研究内容,并通过发人深省的发现让他们意识到人类的判断是有限的。这些发现已经存在了半个多世纪,应该很少有人能避开它们,但人们仍然对这些发现很抵触。 在我们的听众里,有一些高管会很自豪地告诉我们,相比于定量分析,他们更相信自己的直觉;其他人虽然没明说,但他们也有同样的看法。有关

    待学习
    开始阅读
  • 19

    第12章 常态谷:事情虽无法预测,但可以被理解

    第12章 常态谷:事情虽无法预测,但可以被理解 现在我们来考虑一个更大的问题:在这个世界上,有些问题容易解决,有些问题却充满了客观无知,那我们应如何自处呢?毕竟,在存在很严重的客观无知的情况下,我们很快就能意识到,用水晶球来预测未来是徒劳的,但我们通常并不会对这个世界产生这种体验。相反,正如上一章所提到的,我们一直在基于少量的有用信息来对未来做出大胆预测。在

    待学习
    开始阅读
  • 20

    第13章 启发式、偏差与噪声

    第13章 启发式、偏差与噪声 本书是对横跨半个世纪的关于人类直觉判断研究的延续,也就是所谓的“启发式和偏差研究项目”(heuristics and biases program)。《思考,快与慢》一书对该研究项目前40年的研究内容进行了回顾,探讨了能够解释“直觉思维的奇妙与缺陷”的心理机制。该项目的核心思想是,当回答一个难题时,人们会使用简化的思维操作系统—

    待学习
    开始阅读
  • 21

    第14章 匹配,找到与你的预测最精准匹配的共识

    第14章 匹配,找到与你的预测最精准匹配的共识 现在请看向天空,你认为两小时内下雨的可能性有多大?你可能很容易就答出了这个问题。你做出判断时毫不费力。你可能在不知不觉中就把对天空黑暗程度的评估转换成了概率判断。 你刚刚做的事就是一种典型的“匹配”(matching)。我们将判断描述为一种思维操作,该思维操作会为主观印象或印象的某个方面在量表上找到对应的值。匹

    待学习
    开始阅读
  • 22

    第15章 选取精确的量表,并多用相对判断

    第15章 选取精确的量表,并多用相对判断 假设你是民事审判案件中的一名陪审员。你目前所掌握的证据大致如下,你要据此做出判断。 琼·格洛弗(Joan Glover)诉General Assistance公司案 一个名叫琼·格洛弗的6岁小女孩吞下了大量非处方抗过敏药AllerFree,需要住院治疗很长时间。大剂量的药物使她的呼吸系统变得很脆弱,因此她很容易患上哮

    待学习
    开始阅读
  • 23

    第16章 模式噪声的构成

    第16章 模式噪声的构成 还记得朱莉吗?我们在第14章中提到的那个早慧的孩子。你曾尝试预测她的大学GPA。以下是有关朱莉的详细介绍。 朱莉是独生女。她的父亲是一位事业有成的律师,母亲是一位建筑师。朱莉大约3岁时,她的父亲患上了一种自体免疫性疾病,不得不居家办公。他花大量的时间陪伴朱莉,并耐心地教她读书识字。朱莉4岁时就能流畅地阅读。她的父亲也曾尝试教她算术,

    待学习
    开始阅读
  • 24

    第17章 噪声源,偏差是引人注目的图形,而噪声是不受我们关注的背景

    第17章 噪声源,偏差是引人注目的图形,而噪声是不受我们关注的背景 哪里有判断,哪里就有噪声,希望你现在也认同这一观点。我们也希望,对你而言这已不再是一件超乎想象的事。这也正是我们着手开展研究的主要动力。经过多年的努力,我们对这个问题的思考已经逐渐深入和完善。现在,来回顾一下我们已经了解的噪声成分、这些成分对噪声的重要影响以及它们在判断中所起的作用。 噪声成

    待学习
    开始阅读
  • 25

    第18章 卓越的判断者,卓越的判断力

    第18章 卓越的判断者,卓越的判断力 至目前为止,我们主要谈论的是人类的判断,而没有对不同的判断者进行区分。显然,在任何一项任务中,有些人做出的判断要优于其他人。即使是由群体做出的判断,如果该群体由高能力个体组成,那么最终的判断也会更优。这就引出了一个重要的问题,即如何甄别出更好的判断者。 有三件事至关重要。如果做判断的人受过良好的训练、更睿智且拥有正确的认

    待学习
    开始阅读
  • 26

    第19章 消除偏差与决策卫生

    第19章 消除偏差与决策卫生 许多研究人员和机构都力图减少判断偏差。在本章中,我们将分析他们的核心发现。我们将介绍消除偏差的各类干预措施之间的区别,并探讨其中一种值得进一步研究的干预措施。随后,我们将讨论如何减少噪声,并介绍决策卫生的概念。 干预:事后及事前消除偏差 减少偏差有两种主要方式,要描述它们的特点,一个好方法是回到测量类比。假设你家浴室里的体重秤在

    待学习
    开始阅读
  • 27

    第20章 司法科学,信息排序是最大的噪声

    第20章 司法科学,信息排序是最大的噪声 2004年3月,在西班牙首都马德里,一组被放置在通勤列车上的炸弹爆炸,造成192人死亡,2000多人受伤。人们在犯罪现场的塑料袋上发现了一枚指纹,并通过国际刑警组织将其传送到了世界各地的执法机构。几天后,美国联邦调查局(FBI)犯罪实验室最终确认这枚指纹属于一个居住在俄勒冈州的美国公民布兰登·梅菲尔德(Brandon

    待学习
    开始阅读
  • 28

    第21章 甄选与汇总,超级预测的两大策略

    第21章 甄选与汇总,超级预测的两大策略 许多判断都涉及预测,比如,下个季度的失业率可能是多少?明年将售出多少辆电动汽车?2050年的气候变化会带来什么影响?盖完一幢新楼需要多长时间?某家公司的年收入是多少?新员工会有什么样的表现?新的空气污染管理制度的成本是多少?谁将赢得选举?这些问题的答案会产生重大影响,因为私人机构和公共机构的一些重要选择往往取决于这些

    待学习
    开始阅读
  • 29

    第22章 医疗决策,用科学的诊断指南减少噪声

    第22章 医疗决策,用科学的诊断指南减少噪声 几年前,我们的一位好朋友保罗被他的主治医师琼斯诊断为患有高血压。琼斯医生建议保罗尝试药物治疗,他给保罗开了利尿剂,但保罗的血压依旧很高,也就是说药物没起到效果。几个星期后,琼斯又开了第二种药物——钙通道阻滞剂,但效果依然不理想。 这些结果使琼斯困惑不已。虽然过去的3个月保罗每星期都会来复诊,但他的血压只是略有下降

    待学习
    开始阅读
  • 30

    第23章 绩效评估,用基于外部视角的共识框架做出量化判断

    第23章 绩效评估,用基于外部视角的共识框架做出量化判断 让我们从一个练习开始:请选出3个你认识的人,他们可以是你的朋友或同事。请在友善、智慧和勤奋这3种特质上给他们进行1~5分的评分,其中1分是最低分,5分是最高分。现在再请另一个很了解他们的人(这个人可以是你的配偶、好友或者最亲密的同事)用同样的方式对这3个人进行评分。 在某些评估中,你和其他评分者很可能

    待学习
    开始阅读
  • 31

    第24章 人员招聘,以结构化指标衡量人才

    第24章 人员招聘,以结构化指标衡量人才 如果你曾经找过工作,那么“招聘面试”这个词可能会唤起你的一些生动而紧张的回忆。工作面试,即求职者与未来的主管或人力专员会面,是进入许多组织的必经之路。 在大多数情况下,面试遵循着既定的流程。在寒暄之后,面试官会要求应聘者描述他们的个人经历,或者详细地描述他们经历过的某些特定情形。再问一些诸如个人成就与挑战、工作动机以

    待学习
    开始阅读
  • 32

    第25章 中介评估法,做出明智决策的核心方法

    第25章 中介评估法,做出明智决策的核心方法 不久前,我们两个人(卡尼曼和西博尼)与我们的朋友丹·罗瓦洛(Dan Lovallo)一起,介绍过组织中使用的一种决策方法。这一方法的首要目的在于减少噪声,我们称之为中介评估法。该方法涵盖了我们前几章所介绍的大多数决策卫生策略,并且它的应用范围很广泛,只要在计划或选项的评估过程中需要考虑和权衡多维度信息,我们就可以

    待学习
    开始阅读
  • 33

    第26章 减少噪声的成本

    第26章 减少噪声的成本 每当我们建议人们消除噪声时,他们可能会以成本过高为由进行反对,并认为在极端情况下,减少噪声根本不可能。我们已经在商业、教育、政府以及其他领域听到过这种反对意见,这种观点虽然有一定的合理性,但言过其实了,或者只不过是一个借口。 为了证明我们的这种反对意见更有说服力,举一个高中老师为文章评分的例子。有位高中老师每星期都要对学生撰写的25

    待学习
    开始阅读
  • 34

    第27章 尊严,人之为人的重要价值观

    第27章 尊严,人之为人的重要价值观 设想如下三个场景:你申请房产抵押,但被拒绝,其原因并非有人实际考察了你的情况,而是因为银行有严格的规定,认为你这种信用等级的人不能申请房产抵押;你的条件很出色,而且一家公司的面试官也觉得你很不错,但你的求职申请被拒绝了,原因是15年前你曾被判刑,而该公司明令禁止录用任何有犯罪前科的人;你被判有罪,但不能被保释,这并非由于

    待学习
    开始阅读
  • 35

    第28章 规则还是标准

    第28章 规则还是标准 如果我们的目标是减少噪声和了解如何减少噪声(或在多大程度上减少噪声),那么我们就有必要区分两种约束行为的方式:规则和标准。很多组织通常会选择其中的一种,或将两者结合起来使用。 在商业领域,某家公司可能会有以下要求:员工必须在指定的时间内工作;每个人的休假时间不能超过两个星期;如果有人将公司的秘密泄露给媒体,那么他就会被解雇。我们也可以

    待学习
    开始阅读
  • 36

    回顾与总结 正视噪声问题

    回顾与总结 正视噪声问题 噪声是我们在做判断时不希望存在的变异,然而噪声实在太多了,本书的核心目标就在于解释为何会如此,以及我们应该如何应对噪声。本书涵盖的内容十分丰富,我们在这里仅从一个宽泛的视角来对书中的核心观点进行简要的回顾和总结。 判断不是计算,也无须遵循精确的规则 需要注意的是,不要把本书中的“判断”一词与“思考”一词混淆。判断是一个相对狭义的概念

    待学习
    开始阅读
  • 37

    结语 一个噪声很少的世界

    结语 一个噪声很少的世界 请想象一下,经过重新设计并减少了噪声的组织会是什么样子。医院、招聘委员会、经济预测机构、政府机构、保险公司、公共卫生机构、刑事司法系统、律师事务所和大学,都会对噪声问题保持警觉,并努力减少这些问题。噪声审查将会成为惯例,或许每年都能进行一次。 未来,组织的领导者将会在更多领域中使用算法来代替人类判断,或将其作为人类判断的补充。人们会

    待学习
    开始阅读
  • 38

    附录1 如何进行噪声审查

    附录1 如何进行噪声审查 附录1是一份关于如何进行噪声审查的实用指南。你可以以企业顾问的视角来阅读这部分内容,设想一下这家企业雇用你来对它的一个部门员工的专业决策进行噪声审查。 顾名思义,噪声审查的重点当然在于考察噪声的普遍性,然而,良好的噪声审查其实也能提供关于员工培训和工作监管中存在的偏差、盲点和缺陷的有价值信息。成功的审查有利于促进部门改革,包括改进专

    待学习
    开始阅读
  • 39

    附录2 决策观察者检查清单

    附录2 决策观察者检查清单 本附录给出了一份决策观察者(见第19章)检查清单的通用示例。这里提供的清单大致遵循做重要决策的时间顺序。 清单中每一项之后的参考问题都对相应的项目做了进一步说明。决策观察者在审视决策过程时应该问自己这些问题。 决策观察者不应照搬照抄这个清单。我们希望它发挥的作用是为决策观察者提供灵感和基准,并使决策观察者能够据此设计出适合自己的偏

    待学习
    开始阅读
  • 40

    附录3 对抗噪声,修正预测

    附录3 对抗噪声,修正预测 匹配性预测是我们依赖直觉式匹配过程而产生的错误(参见第14章)。当我们基于现有信息做预测时,我们会进行匹配性预测,就好像我们能够依据这些信息对结果做出完美的或准确率非常高的预测一样。 让我们来回顾一下朱莉的例子,她4岁就能流利地阅读,那么她在大学时的GPA会是多少呢?如果你预测朱莉在大学时的GPA是3.8,这就意味着你从直觉上判断

    待学习
    开始阅读
  • 41

    致谢

    我们要感谢很多人。林内亚·甘地(Linnea Gandhi)是我们的参谋长,她为我们提供了大量的指导和帮助,使我们的工作可以有条不紊地推进,让我们的工作充满欢声笑语。基本可以说,是她主持了本书的撰写。除此之外,她还为本书的初稿提出了许多宝贵建议,没有她,我们无法顺利完成本书。丹·罗瓦洛对成书也起到了非常重要的作用,本书的观点最初就源于他与人合著的一篇文章。我

    待学习
    开始阅读
  • 42

    译者后记

    汪祚军 中国科学院心理研究所博士,宁波大学教授 感谢编辑部独具慧眼,能够邀请中国科学院心理研究所李纾研究员领衔本书的翻译工作。李纾老师是国内最早从事行为决策研究的专家,在行为决策领域深耕数十年,其提出的“齐当别”决策模型在心理学界具有重要的影响力。作为行为决策领域的一名研究者、李纾老师曾经的博士生,能够参与本书的翻译工作,我深感荣幸。 在拿到本书的英文原书后

    待学习
    开始阅读
  • 43

    注释

    引言 偏差与噪声,人类判断的两类错误 射击场只是一种隐喻:1778年,瑞士数学家丹尼尔·伯努利(Daniel Bernoulli)在一篇关于评估问题的论文中使用弓和箭进行了相同的类比。Bernoulli, “The Most Probable Choice Between Several Discrepant Observations and the For

    待学习
    开始阅读

Local EPUB Text

第20章 司法科学,信息排序是最大的噪声

第20章 司法科学,信息排序是最大的噪声

2004年3月,在西班牙首都马德里,一组被放置在通勤列车上的炸弹爆炸,造成192人死亡,2000多人受伤。人们在犯罪现场的塑料袋上发现了一枚指纹,并通过国际刑警组织将其传送到了世界各地的执法机构。几天后,美国联邦调查局(FBI)犯罪实验室最终确认这枚指纹属于一个居住在俄勒冈州的美国公民布兰登·梅菲尔德(Brandon Mayfield)。

梅菲尔德看起来有很大的犯罪嫌疑。他曾是美国陆军军官,娶了一名埃及女子为妻。后来,他曾作为一名律师,为一些被指控(后来被定罪)试图前往阿富汗加入塔利班的人辩护。因此他上了FBI的监视名单。

有关机构开始监视梅菲尔德,搜查了他的房子,窃听他的电话。在上述审查未能获得任何实质性证据的情况下,FBI逮捕了他。但他从未被正式指控过。梅菲尔德已有10年没出过国。在他被羁押期间,西班牙调查人员通知FBI,他们认为塑料袋上的指纹与梅菲尔德的指纹不符,而与另一名嫌疑人的指纹相符。

两个星期后,梅菲尔德获释。最终,美国政府向他道歉,支付了200万美元的和解金,并下令对发生这种错误的原因进行全面调查。调查的核心结论是:“错误是人为所致,而不是方法或技术上的问题所致。”

幸好,这种人为错误很少见。尽管如此,它们还是引人深思。美国经验最丰富的指纹专家怎么会误把一枚指纹认定为属于一个从未接近过犯罪现场的人呢?要找到答案,我们首先需要了解指纹鉴定的流程,以及它与其他专业判断案例的关系。我们通常认为司法科学中的指纹鉴定是一门精确的科学,但实际上它会受鉴定人员心理偏差的影响。这些偏差会导致噪声,这些噪声又会产生大量错误,这样的情况之多远超我们的想象。我们来看看司法科学界是如何通过实施一项适用于所有环境的决策卫生策略来解决这一问题的,这个决策卫生策略就是:严格控制用于做出判断的信息流动。

指纹识别,身份识别中备受重视的技术

指纹是手指的脊线纹理在我们接触的物体表面留下的印记。在古代就已经有把指纹当作识别身份的显著特征的例子,而现代指纹技术则始于19世纪末。当时,苏格兰医生亨利·福尔兹(Henry Faulds)发表了一篇科学论文,首次提出将指纹用于身份识别的技术。

在随后的几十年里,指纹作为犯罪记录中的身份标识越来越受到重视,指纹技术逐渐取代了法国警官阿方斯·贝蒂伦(Alphonse Bertillon)发明的人体测量技术。贝蒂伦于1912年开发了一套对指纹进行比对的正式系统。群体智慧的发现者弗朗西斯·高尔顿爵士(Sir Francis Galton)在英国也开发了类似的体系。不过,这些奠基者并没有受到人们的称赞。高尔顿相信指纹是对个体进行种族划分的有效工具,而贝蒂伦可能是出于反犹太主义的倾向,于1894年至1899年在对阿尔弗雷德·德雷弗斯(Alfred Dreyfus)一案的审判中,做出了起决定作用但有误的专家证词。

警察很快发现,指纹的功用不只是可以作为惯犯的识别标志。1892年,阿根廷警官胡安·武塞蒂奇(Juan Vucetich)首次将隐藏在犯罪现场的指纹与嫌疑人的拇指指纹进行了比对。从那时起,收集隐藏指纹(在犯罪现场获得的指纹)并将其与样本指纹(在受控条件下从已知个体身上收集到的指纹)进行比对的做法,一直是指纹识别最关键的操作,并成为应用最广泛的司法鉴定的证据。

如果你见过电子指纹读取器,就像许多国家的移民局使用的那种,你可能会认为指纹比对是一项简单、机械、容易进行自动化作业的任务。但是,比起匹配两个清晰的指纹,把从犯罪现场收集到的隐藏指纹与样本指纹进行比对要烦琐得多。当你把手指紧紧地按在一个专门用来记录指纹印记的阅读器上时,会产生一个整洁、标准化的图像。相比之下,隐藏指纹往往只有一部分,或是不清楚,或是已经变形。它们提供的信息数量和品质与在精心准备的环境中收集到的指纹是没有可比性的。此外,隐藏指纹常常与其他指纹重叠,这些指纹可能属于同一个人,也可能属于不同的人。隐藏指纹的表面可能会出现污垢和其他瑕疵。确定它们是否与犯罪嫌疑人的指纹样本相符需要专业的判断,这就是人类指纹鉴定人员的工作。

拿到隐藏指纹后,指纹鉴定人员通常遵循一套称为ACE-V的过程,即分析(Analysis)、比较(Comparison)、评估(Evaluation)和核验(Verification)。他们必须先分析隐藏指纹,判断它是否有进行比对的价值,如果有,他们会把这枚指纹和样本指纹进行比对;比对后他们加以评估;评估后他们会得出相符(指纹是同一个人的)、排除(指纹不是同一个人的)或无法确认这三种结论。需要重新鉴定的决策会触发最后一步:由另一位指纹鉴定人员重新进行核验。

几十年来,对这一程序的可靠性一直没有人质疑。尽管目击者的证词被证明有时是非常不可靠的,甚至供词也可能是假的,但指纹一直被认为是最可信的证据——至少在DNA分析出现之前一直是这样。2002年以前,在美国的法庭上没有人质疑过指纹证据的可信度。例如,当时的FBI网站就坚称:“指纹鉴定是一种绝对不会出错的个人身份识别手段。”在极少数确实出现了错误的情况下,错误会被归结为鉴定人员能力不足或造假。

指纹证据在很长一段时间内都没有受到质疑的部分原因是,很难证明它是错的。一组指纹的“真实值”,也就是实际罪犯的真实身份往往是未知的。对于梅菲尔德和少数类似案件来说,这个错误尤其严重。但一般来说,即便嫌疑人否认指纹鉴定人员的结论,人们也倾向于认为指纹证据更加可靠。

我们注意到,不知道真实值是普遍现象,但这并不妨碍我们对噪声进行测量。指纹分析中有多少噪声?或者更准确地说,假设指纹鉴定人员与法官或核保员不一样,指纹鉴定人员不是要给出一个数字,而是要做出一个明确的判断,那么他们有多大可能性会意见不一?为什么会这样?这些问题是伦敦大学认知神经科学研究员伊蒂尔·德鲁尔(Itiel Dror)最先着手研究的。他在一个被假定没有噪声问题的领域,进行了一系列类似于噪声审查的研究。

指纹分析中的情境噪声

对于一位认知科学家或心理学家来说,挑战指纹鉴定人员似乎有些奇怪。毕竟,正如你在《犯罪现场调查》(CSI: Crime Scene Investigation)系列节目中所看到的,这些都是需要戴乳胶手套、手持显微镜进行研究的硬科学。但德鲁尔意识到,指纹验证显然是一个判断问题。作为认知神经科学家,他断言:哪里有判断,哪里就有噪声。

为了验证这一假设,德鲁尔首先聚焦于情境噪声,即让同一位专家对同一证据进行两次验证,再观察他的前后两次判断之间的差异。正如德鲁尔所说:“如果专家不可靠到自相矛盾的地步,那么他们的判断和专业性的基础就值得怀疑。”

指纹分析为检查情境噪声提供了一个完美的测试平台,这是因为,不像医生或法官遇到的案件,成对的指纹不容易被记住。当然,必须留出适当的时间间隔,以确保鉴定人员不会记住指纹。在德鲁尔的研究中,一些勇敢、思想开放的专家同意,在未来5年中的任何时候,他们都愿意在不知情的情况下参与研究。此外,实验必须在专家的日常工作过程中进行,这样他们就不会意识到有人在验证自己的技能。如果在这种情况下,鉴定人员在两次测试中的判断不一致,那就证明指纹鉴定中确实存在情境噪声。

缺乏独立性,司法科学的证实性偏差

以上述专家同意为基础,德鲁尔对此前的研究做了调整,又进行了两项研究,这一次,他引入了一个重要的变化。当第二次看到指纹时,一些检验人员会受到可能使这个案例出现更多偏差的信息的影响。例如,指纹鉴定人员在第一次验证时发现指纹是匹配的,但这次却得知“嫌疑人有不在场证明”或“枪支方面的证据表明他不是嫌疑人”。另外一些鉴定人员最初认定嫌疑人是无辜的或指纹无法确定,但在第二次验证中,他们被告知“侦探相信嫌疑人有罪”“目击者指认了他”“他供认了罪行”。德鲁尔称这项实验是对专家“可偏差性”的测试,因为实验人员所提供的背景信息激活了指纹鉴定人员在特定方向上的心理偏差(证实性偏差)。

事实上,鉴定人员很容易产生偏差。当同一批鉴定人员再次鉴定之前看到的相同指纹时,由于这次有了偏差信息,他们的判断也发生了改变。在第一项研究中,4/5的专家在面对强有力的背景信息时改变了他们先前做出的比对相符的决策。在第二项研究中,6位专家重新鉴定了4对指纹。在先前的24个决策中,偏差信息导致了4个决策的改变。可以肯定的是,他们的大多数决策并没有改变,但对于这类决策而言,1/6的改变可以算是很大的比例了。这些研究发现也得到了其他研究人员的证实。

正如我们所料,当决策一开始就很难做出,偏差信息又很强烈,而且对应的改变是从结论确凿的决策变为不确定的决策时,鉴定人员更有可能改变主意。然而,令人不安的是,指纹鉴定专家往往是根据背景环境做出决策的,而不是根据指纹中包含的实际信息来判断。

偏差信息影响的不仅仅是鉴定人员的结论(相符、无法确认或排除),它实际上还改变了鉴定人员对信息的感知,以及对这种感知的解释。在另一项独立研究中,德鲁尔和他的同事们发现,那些处于偏差环境中的鉴定人员,与那些没有接触偏差信息的鉴定人员看到的东西不同。当隐藏指纹与目标样本指纹同时出现时,鉴定人员观察到的细节(微小的细节)明显少于他们只看到隐藏指纹时所观察到的细节。随后的一项独立研究证实了这一结论,并且实验人员补充道:“我们并不清楚它是如何发生的。”

德鲁尔为偏差信息的影响创造了一个术语:司法科学证实性偏差。这一偏差后来为其他司法科学技术所引证,包括血型分析、纵火调查、骨骼遗骸分析和法医病理学。即使是被普遍视为司法科学新黄金标准的DNA分析,也容易受到证实性偏差的影响,至少在专家们评估复杂的DNA混合物时是如此。

司法科学专家易受证实性偏差的影响不仅是一个理论层面的问题,因为现实中尚没有系统性的预防措施来确保专家们不会接触偏差信息。鉴定人员经常会在随证据一起提交给他们的传送信函中收到此类信息,也经常会与警察、检察官和其他鉴定人员直接沟通。

证实性偏差还引发了另一个问题。为避免犯错,人们在ACE-V程序中加入了一项重要的安全措施,那就是在确认指纹的信息之前,由另一位专家独立进行一次验证。但大多数情况下,只有结果是“需要重新识别”时才需要独立验证。这很可能会导致证实性偏差,因为执行核实工作的鉴定人员知道最初的结论是“需要重新识别”。因此,验证的这一步并不像大家预想的那样,能够带来聚合多个独立判断的好处,因为验证实际上并不是独立的。

在梅菲尔德一案中,一系列的证实性偏差似乎起了作用。在这起案件中,不止两位,而是三位FBI专家为错误的身份识别“投下了赞成票”。后来针对这一错误展开的调查指出,第一位鉴定人员似乎非常相信计算机系统自动从指纹数据库中搜索出的结果。虽然他明显没有接触到梅菲尔德的个人基本信息,但执行初步搜索的计算机系统提供的结果,加上处理一个极为引人注目的案件带来的心理压力,足以导致初步的证实性偏差。报告继续指出,一旦第一位鉴定人员做出错误的鉴定,随后的鉴定就被污染了。由于第一位鉴定人员是一位备受尊敬的监督员,“机构中的其他人难有异议”。最初的错误被复制和放大,导致人们几乎就认定了梅菲尔德有罪。到了这一步,哪怕是一位备受尊敬的独立专家接受法院指派代表梅菲尔德的辩护方审查证据,他也会和FBI的意见一致,确认指纹相符。

同样的现象也可能发生在其他司法鉴定领域。隐藏指纹识别被誉为各鉴定领域中最客观的分析手段,如果指纹鉴定人员在操作过程中都存在偏差,那么其他领域的专家也会如此。此外,如果一位枪支专家知道指纹是匹配的,这种信息也会影响他的判断。如果牙齿鉴定专家知道DNA分析已经确认了犯罪嫌疑人,那么这位专家就不太可能认为咬痕与犯罪嫌疑人不匹配。这些例子引发了人们对一系列偏差的恐惧:正如我们在第8章中描述的群体决策一样,由证实性偏差引发的初始错误变成了影响第二位专家的偏差信息,第二位专家的判断又会使第三位专家产生偏差,依此类推。

在明确了偏差信息会导致判断错误后,德鲁尔和他的同事们发现了更多的关于情境噪声的证据。即使指纹专家没有接触到偏差信息,他们有时也会对自己先前见过的一组指纹改变看法。在没有给出偏差信息的情况下,改变确实更少发生但无法杜绝,这些与我们预想的情况相符。2012年,FBI委托进行的一项研究更大规模地重现了这一发现,该研究要求72名鉴定人员再次查看他们在大约7个月前评估过的25对指纹。借助这一高质量鉴定人员的大样本,该研究表明,指纹专家有时容易受到情境噪声的影响,而且大约有1/10的决策改变了。大多数的改变要么从“相符”变成了“无法确认”,要么就是反过来,没有一个决策的改变是源于鉴定错误的。这项研究最令人不安的地方在于,它表明一些原本可以定罪的指纹先前可能被判定为“无法确认”。当鉴定人员验证相同的指纹时,即使背景环境不是为了使他们产生偏差而是要尽可能让他们保持一致,他们的决策也存在不一致性。

少许噪声,但多少误差呢

这些研究结果反映出现实生活中有可能存在司法错误。我们不能忽视出庭作证专家的可信度问题:可信度是效度的条件,原因很简单,如果你自己的判断都会不一致,那么它也难以与真实情况一致。

究竟有多少错误是由司法鉴定中出现的错误造成的?美国一个致力于推翻错案的非营利性组织“无辜者计划”(Innocent Project)收集了350个改判无罪的案件。一份针对这些案件的回顾指出:在45%的案件中,司法鉴定科学的误用是促成错判的一个原因。这个统计数字听起来很恐怖,但法官和陪审员关注的重点有所不同:他们要知道包括指纹鉴定人员在内的司法鉴定专家犯相应错误的可能性有多大,才能知道应给予出庭作证的鉴定者们多少信任。

这个问题的最有力答案可以在总统科技顾问委员会(President’s Council of Advisors on Science and Technology,PCAST)的一份报告中找到。PCAST是一个由美国顶尖科学家和工程师组成的咨询小组,它在2016年对刑事法庭中的司法鉴定进行了全面回顾。其报告总结了指纹分析有效性的现有证据,特别是与错误身份识别(假阳性)的可能性相关的证据,例如关于梅菲尔德的指纹的鉴定。

这方面的证据少得可怜,就像PCAST指出的那样,收集这方面证据的工作直到最近才开展,这实在“令人痛心”。最可信的数据来自2011年FBI的科学家进行的唯一一项大规模指纹识别准确性研究。这项研究有169名鉴定人员参与,每个人都对比了大约100对隐藏指纹和样本指纹,并发现错误的鉴定很少——假阳性率约为0.17%。

0.17%的错误率的确很低,但报告指出:“鉴于一直以来在媒体宣传中指纹鉴定被赋予的高准确性,这一比例要比普通公众乃至大部分陪审员认为的高很多。”这项研究未包含任何有偏差的背景信息,而且鉴定人员知道他们在参加测试,这可能导致该项研究低估了实际案例中出现的错误。在佛罗里达州进行的一项后续研究发现的假阳性率要高得多。这些研究报告中的各种发现表明,我们需要更多的研究来确定指纹鉴定人员决策的准确性以及这些决策是如何做出的。

然而,所有研究得到的一致发现是,鉴定人员犯错的原因都是过于谨慎,这一发现令人欣慰。诚然他们无法做出百分之百准确的判断,但他们知道自己的判断可能会造成什么样的后果,并考虑到了潜在错误的代价。由于指纹识别的可信度非常高,错误的身份识别可能会导致灾难性的后果。其他类型的错误则不会有那么严重的后果。例如,FBI的专家观察发现:在大多数案件中,“排除”与“无法确认”对案件本身产生的影响是一样的,换句话说,在凶器上发现的指纹证据足以证明嫌疑人有罪,但没有指纹证据并不足以证明嫌疑人无罪。

不仅鉴定人员在做判断时会非常谨慎,证据还表明,专家在做出识别决策之前也会考虑再三。在FBI关于身份识别准确性的研究中,不到1/3的“配对”指纹对(隐藏指纹和样本指纹属于同一个人)被(准确地)判定为身份识别成功。与假阴性(排除)相比,鉴定人员做出的假阳性判断(错误识别)也要少得多。他们容易受到偏差的影响,但在这两个方向上的偏差并不等同。正如德鲁尔所指出的,“比起确定的‘相符’的结论,法医专家更倾向于做出‘不确定’的结论”。

鉴定人员接受过训练,因而会将错误的身份识别看成一种不惜一切代价也要避免的致命罪过。值得称道的是,他们遵循了这一原则,我们只能希望他们对身份识别错误的谨慎态度能使像梅菲尔德案这样的身份识别错误的热点案件少之又少。

倾听噪声,减少噪声的第一步

我们观察到在司法科学中存在噪声,这不应视为对法医学家的批评。这仅仅是我们反复观察的结果:哪里有判断,哪里就有噪声,而且比你想象的还要多。像指纹分析这样的任务似乎是十分客观的,以至于许多人根本不会将其视为判断的一种形式。尽管如此,不一致、分歧和偶尔出错在该领域也在所难免。无论指纹识别的错误率有多低,它都不是零,正如PCAST所指出的那样,陪审团应该意识到这一点。

当然,减少噪声的第一步必须是承认它可能存在。指纹识别领域的成员并没有自然而然地承认这一点,他们中的许多人最初对德鲁尔的噪声审查表示非常怀疑。“鉴定人员可能会在不经意间受到案件信息的影响”,这一说法激怒了很多专家。指纹学会(Fingerprint Society)主席就德鲁尔的研究进行了回复:“如果哪位指纹鉴定人员在决策过程中受到了影响……那么他就太不成熟了,他应该去迪士尼工作。”一家大型法医学实验室的负责人指出,接触那些可能使鉴定人员产生偏差的案件信息,“会令鉴定人员获得满足感,让他们享受工作,而不会真正改变他们的判断”。就连FBI在梅菲尔德案的内部调查中都强调,“隐藏指纹的鉴定人员通常会进行核查,他们知道之前的鉴定人员的结果,但这些结果并不会影响他们的结论”。这些言论基本等于否认了证实性偏差的存在。

即使意识到了偏差的风险,鉴定专家也无法避免偏差盲点,即他们倾向于承认他人存在偏差,但认为自己不会。一项对21个国家400名鉴定专家展开的调查显示,71%的人认同“认知偏差是整个司法鉴定科学中一个令人担忧的因素”,但只有26%的人认为“自己的判断受到了认知偏差的影响”。换句话说,大约一半的司法专业人士认为,他们的同事的判断有噪声,但他们自己的判断并不存在噪声。噪声可能是一个看不见的问题,甚至对那些工作职责就是“发现这种不可见”的人来说亦是如此。

对信息排序,一个好的决策者应该努力“保持怀疑”

多亏了德鲁尔及其同事的坚持,人们的态度正在慢慢改变,越来越多的法医实验室已经开始采取新的措施来减少他们分析中的误差。例如,PCAST在报告中赞扬了FBI实验室重新设计程序以尽量减少证实性偏差的风险这一举措。

必要的方法论步骤是简单明了的。它们阐明了一个适用于许多领域的决策卫生策略:通过对信息进行排序来限制过早地使用直觉。在所有判断中,有些信息是相关的,有些则不是,而且信息并非总是越多越好,在信息有可能诱导鉴定人员过早地根据直觉下判断并导致判断产生偏差时尤其如此。

本着这一精神,为确保鉴定人员判断的独立性,司法实验室采用的新程序只有在鉴定人员需要时,才会向他们提供所需的信息。换言之,实验室会逐步透露信息,尽可能地让他们“蒙在鼓里”。因此,德鲁尔及其同事设计的方法被称为“线性序列揭露”(linear sequential unmasking)。

德鲁尔的另一项建议也说明了相同的决策卫生策略:鉴定人员应记录他们在每一步做出的判断。他们应该在查看样本指纹之前记录对隐藏指纹的分析,再判断二者是否匹配。这一系列步骤能帮助专家避免只看到他们正在寻找的东西。他们应该在接触到有可能使自己产生偏差的背景信息之前,记录自己对证据的判断。如果他们在接触到背景信息后改变了主意,也应该记录这些改变及做出改变的理由。这项要求限制了先前的直觉使整个过程产生偏差的风险。

依据同样的逻辑,我们可以提出第三条建议,这也是决策卫生的重要组成部分,即当要求另一名鉴定人员核实第一名鉴定人员做出的身份识别时,第二个人不应知道第一个人的判断。

司法鉴定中存在噪声必然值得关注,因为事关生死,但这也说明了一个问题。长期以来,我们完全没有意识到,指纹识别竟然也可能会出现错误,这说明我们对专家判断的信心有时被夸大了,噪声审查也会暴露出意想不到的噪声数量。简单地改变一下流程就可以改善这种不足,对所有关心提高决策品质的人来说,这一事实令人振奋。

本案例所说明的主要决策卫生策略(对信息进行排序)具有广泛的适用性,可作为预防情境噪声的措施。我们已经注意到,情境噪声是由各种各样的因素触发的,包括情绪,甚至温度。你不能指望控制住所有触发因素,但你可以尝试避免那些会对判断造成明显影响的因素。例如,你已经知道愤怒、恐惧或其他情绪可能会改变判断,于是你也意识到,如果可以的话,在不同时间重复审视自己的判断是一个不错的办法,因为情境噪声的触发因素在不同时间可能不同。

有一种不太显而易见的可能性,那就是你的判断在不知不觉中被另一种触发情境噪声的因素所改变,这种因素就是信息,甚至是准确的信息。就像指纹鉴定人员的例子一样,一旦你知道别人的想法,证实性偏差会导致你过早地形成一个整体印象,并忽略与其矛盾的信息。我们可以用阿尔弗雷德·希区柯克(Alfred Hitchcock)的两部电影的名称来概括这一点:一个好的决策者应该努力“保持怀疑”(Shadow of a Doubt,片名又译《辣手摧花》),而不要成为“已经知道太多的人”(The Man Who Knew Too Much,片名又译《擒凶记》)。