学习进度

0%

阅读时长

未满 1 分钟

最近阅读:未开始阅读

核心概念

待提炼

章节学习

  • 1

    献词

    献给诺加、奥里和吉利 ——丹尼尔·卡尼曼 献给范丁和莱莉亚 ——奥利维耶·西博尼 献给萨曼莎 ——卡斯·R.桑斯坦

    待学习
    开始阅读
  • 2

    重磅赞誉

    从“偏差”到“噪声”,作为心理学家的卡尼曼,挑战的是经济学的“理性人”假设,并因开启了行为经济学的大门而获得诺贝尔经济学奖。他一直关注的是人类在决策中是如何犯错的,在这本书中,他深入分析了噪声的影响,但也乐观地预期,可以通过发掘埋没在大数据中的信息来减少决策中的噪声,这可以说是大数据渗透到行为经济学领域的新趋势。 巴曙松 北京大学汇丰金融研究院执行院长,中国

    待学习
    开始阅读
  • 3

    测一测 如何做一个聪明的决策者?

    测一测 如何做一个聪明的决策者? 想知道你的判断 是怎么掉入噪声陷阱的吗? 扫码测一测, 立即获取答案及解析, 看看你的“降噪等级”。 1.卡尼曼是世界上第一个凭借心理学研究获得诺贝尔经济学奖的人。这个说法对吗? A.对 B.不对 2.卡尼曼指出:人类判断出错的原因有两种。一种是偏差,另一种是什么呢? A.误差 B.噪声 C.系统认知 3.在做一个判断时,以

    待学习
    开始阅读
  • 4

    推荐序1 在无法回避噪声的世界,更好地追求高级境界与极致效益

    推荐序1 Preface 在无法回避噪声的世界, 更好地追求高级境界与极致效益 彭凯平 清华大学社会科学学院院长 每年七八月份,我都会参加清华大学的本科生招生工作,由此而目睹了一个问题:高考揭榜之后,高中毕业生及其家长应如何做好志愿填报?学校和专业的选择非常重要,很有可能会决定一个学生一辈子的命运,其中牵涉的问题就与我们心理学中一个重要的研究领域紧密相关,那

    待学习
    开始阅读
  • 5

    推荐序2 穿越噪声的决策

    推荐序2 Preface 穿越噪声的决策 朱宁 上海交通大学上海高级金融学院金融学教授,副院长 我抱着浓厚的兴趣读完了诺贝尔经济学奖得主丹尼尔·卡尼曼教授等的新作《噪声》一书,这本书汇集了卡尼曼教授近十年的最新发现。对于我所从事的行为金融学研究领域而言,《噪声》算得上是一本“专业书”,但是读完之后,我认为它很可能是卡尼曼教授继《思考,快与慢》后,又一次成功将

    待学习
    开始阅读
  • 6

    中文版序 哪里有判断,哪里就有噪声

    中文版序 Preface 哪里有判断,哪里就有噪声 我们非常荣幸,也非常感激,能够在中国出版这本书。《噪声》重点关注人类的判断,关注它是如何出错的,以及如何让它变得更好。无论是医学、法律、公共政策、商业,还是日常生活领域中,我们做出判断的过程中存在的问题,是偏好根据经验做判断的人类的共性问题。 数十年来,偏差问题备受瞩目。在《思考,快与慢》一书中,本书的作者

    待学习
    开始阅读
  • 7

    引言 偏差与噪声,人类判断的两类错误

    引言 Introduction 偏差与噪声,人类判断的两类错误 试想一下,你的朋友组成了A、B、C、D共4支队伍,来到一个射击场。每队中有5个人,他们共用一支来复枪,且每人只开了一枪。图0-1显示了他们的射击结果。 图0-1 4支队伍的射击结果 理想情况是,每一枪都能正中靶心。 A队几乎达到了理想情况,他们的每一发子弹都紧紧围绕着靶心,接近完美模式。 B队的

    待学习
    开始阅读
  • 8

    第1章 犯罪和充满噪声的判罚

    第1章 犯罪和充满噪声的判罚 假设某人被指控犯了罪,例如到商店行窃、私藏海洛因、袭击他人或持枪抢劫,该案件可能的判决结果是什么? 答案不应取决于该案件恰巧被指派给哪位法官、天气是冷是热,以及当地球队在前一天是输是赢。如果3个背景类似的人被指控犯有同一罪行,最后却得到截然不同的处罚,例如第一个人被判缓刑,第二个人被判2年有期徒刑,最后一个人被判10年有期徒刑,

    待学习
    开始阅读
  • 9

    第2章 系统噪声,给人达成一致的错觉

    第2章 系统噪声,给人达成一致的错觉 我们最初接触噪声,并对这个主题产生兴趣,并不是因为遇到了像刑事司法案件那般富有戏剧性的案例。实际上,这次邂逅纯属偶然,缘于一家保险公司,这家公司与我们中的两人所属的咨询公司有合作。我们的研究揭示了营利性组织中存在噪声问题的严重性——组织会因为决策中的噪声损失惨重。我们在保险公司的经历有助于解释为什么噪声问题常常被忽视,以

    待学习
    开始阅读
  • 10

    第3章 单一决策,仅发生一次的重复决策

    第3章 单一决策,仅发生一次的重复决策 到目前为止,我们所讨论的案例研究都与重复决策相关。比如,对盗窃犯的恰当判决是什么?对某一特定风险该收取多少保费?虽然每个具体的案例在某种意义上都是独特的,但像这样的判断属于重复决策。医生诊断患者,法官审理假释案件,招生人员审查入学申请书,会计师准备税单等,这些都是重复决策。 正如前一章所介绍的,重复决策中的噪声可以通过

    待学习
    开始阅读
  • 11

    第4章 什么是判断

    第4章 什么是判断 本书论述的是一般意义上的专业判断,我们假设如果做判断的人有足够的能力,就能做出准确的判断。然而,判断这一概念本身包含着一个你不得不承认的事实:你永远无法确定一个判断是不是准确。 请思考“判断问题”和“主观判断”这两个短语的差别。我们认为“太阳明天会升起”或“NaCl是氯化钠的化学式”这样的陈述并非判断,因为任何理性的人都会完全同意上述观点

    待学习
    开始阅读
  • 12

    第5章 测量误差,噪声与偏差的代价一样大

    第5章 测量误差,噪声与偏差的代价一样大 显而易见的是,一致性的偏差会引发代价高昂的错误。如果体重秤在你每次称体重时都自动加上一定的重量,如果一位乐观的经理总是预测项目只需花费实际所需时间的一半,如果一位谨小慎微的经理总是年复一年地低估未来的销售额,那么后果都将会非常严重。 我们已经知道,噪声会引发代价高昂的错误。如果一位经理大多数时候预测的项目所需时间只是

    待学习
    开始阅读
  • 13

    第6章 噪声分析:所有判断都存在3类噪声

    第6章 噪声分析:所有判断都存在3类噪声 在上一章,我们讨论了单个案例中测量或判断的变异性。在单个案例中,判断的所有变异性都是误差,而误差由偏差和噪声组成。我们考察的判断系统,包括法院和保险公司的判断系统,它们的目的在于处理不同案例,并对这些案例进行区分。如果美国的联邦法官和保险理赔员对他们手头的所有案例都做出相同的判断,那他们就没有什么存在的价值了。对不同

    待学习
    开始阅读
  • 14

    第7章 情境噪声,无时无刻不在影响着我们的判断

    第7章 情境噪声,无时无刻不在影响着我们的判断 想象一名职业篮球运动员正在准备罚球的场景:他站在罚球线上,全神贯注地准备投篮。这是他练习过无数次的一系列动作,他能投中吗?我们无法预知结果。 在NBA的比赛中,球员们通常能够4罚3中。显然,一些球员比其他球员表现得更好,但没有人能做到百发百中(3)。虽然篮筐一直都是距离地面3.05米,与罚球线的垂直距离一直是4

    待学习
    开始阅读
  • 15

    第8章 群体是如何放大噪声的

    第8章 群体是如何放大噪声的 个体判断中存在噪声的结果已经很糟糕了,但群体决策中的噪声危害更甚。群体决策可能会由于一些无关因素而朝任何一个方向改变。谁先发言、谁后发言,谁说话更自信,谁穿着黑色衣服,谁和谁挨着坐,谁在某个时刻笑了/皱眉了/呈现出其他身体姿势……所有这些因素都会影响结果。相似的群体每一天都会做出各种不同的决策,如雇用、晋升、破产、沟通策略、环境

    待学习
    开始阅读
  • 16

    第9章 判断与模型,简单的模型普遍优于人类判断

    第9章 判断与模型,简单的模型普遍优于人类判断 很多人都对预测未来的工作绩效感兴趣,不只是自己的,还有别人的。因此,绩效预测是用来考察预测性判断的实用例子。例如,一家大公司在招聘高管时,聘请了一家专业咨询公司对两名候选人莫妮卡和娜塔莉进行评估,并以取值为1~10分的量表对两人的领导力、沟通能力、人际交往能力、职业技能、应聘动机等维度进行打分(见表9-1)。你

    待学习
    开始阅读
  • 17

    第10章 无噪声的规则

    第10章 无噪声的规则 近年来,人工智能(Artificial Intelligence)特别是机器学习技术让机器能够执行许多以前只有人类才能执行的任务。机器学习算法可以承担人脸识别、语言翻译、分析医学影像等任务,并且可以以惊人的速度和准确性来处理计算问题,例如为成千上万名驾驶员迅速规划行车路线。它们还可以执行困难的预测任务:预测美国最高法院的判决;识别哪些

    待学习
    开始阅读
  • 18

    第11章 哪里有预测,哪里就有客观无知

    第11章 哪里有预测,哪里就有客观无知 我们经常同一些公司高管分享第9章和第10章中的研究内容,并通过发人深省的发现让他们意识到人类的判断是有限的。这些发现已经存在了半个多世纪,应该很少有人能避开它们,但人们仍然对这些发现很抵触。 在我们的听众里,有一些高管会很自豪地告诉我们,相比于定量分析,他们更相信自己的直觉;其他人虽然没明说,但他们也有同样的看法。有关

    待学习
    开始阅读
  • 19

    第12章 常态谷:事情虽无法预测,但可以被理解

    第12章 常态谷:事情虽无法预测,但可以被理解 现在我们来考虑一个更大的问题:在这个世界上,有些问题容易解决,有些问题却充满了客观无知,那我们应如何自处呢?毕竟,在存在很严重的客观无知的情况下,我们很快就能意识到,用水晶球来预测未来是徒劳的,但我们通常并不会对这个世界产生这种体验。相反,正如上一章所提到的,我们一直在基于少量的有用信息来对未来做出大胆预测。在

    待学习
    开始阅读
  • 20

    第13章 启发式、偏差与噪声

    第13章 启发式、偏差与噪声 本书是对横跨半个世纪的关于人类直觉判断研究的延续,也就是所谓的“启发式和偏差研究项目”(heuristics and biases program)。《思考,快与慢》一书对该研究项目前40年的研究内容进行了回顾,探讨了能够解释“直觉思维的奇妙与缺陷”的心理机制。该项目的核心思想是,当回答一个难题时,人们会使用简化的思维操作系统—

    待学习
    开始阅读
  • 21

    第14章 匹配,找到与你的预测最精准匹配的共识

    第14章 匹配,找到与你的预测最精准匹配的共识 现在请看向天空,你认为两小时内下雨的可能性有多大?你可能很容易就答出了这个问题。你做出判断时毫不费力。你可能在不知不觉中就把对天空黑暗程度的评估转换成了概率判断。 你刚刚做的事就是一种典型的“匹配”(matching)。我们将判断描述为一种思维操作,该思维操作会为主观印象或印象的某个方面在量表上找到对应的值。匹

    待学习
    开始阅读
  • 22

    第15章 选取精确的量表,并多用相对判断

    第15章 选取精确的量表,并多用相对判断 假设你是民事审判案件中的一名陪审员。你目前所掌握的证据大致如下,你要据此做出判断。 琼·格洛弗(Joan Glover)诉General Assistance公司案 一个名叫琼·格洛弗的6岁小女孩吞下了大量非处方抗过敏药AllerFree,需要住院治疗很长时间。大剂量的药物使她的呼吸系统变得很脆弱,因此她很容易患上哮

    待学习
    开始阅读
  • 23

    第16章 模式噪声的构成

    第16章 模式噪声的构成 还记得朱莉吗?我们在第14章中提到的那个早慧的孩子。你曾尝试预测她的大学GPA。以下是有关朱莉的详细介绍。 朱莉是独生女。她的父亲是一位事业有成的律师,母亲是一位建筑师。朱莉大约3岁时,她的父亲患上了一种自体免疫性疾病,不得不居家办公。他花大量的时间陪伴朱莉,并耐心地教她读书识字。朱莉4岁时就能流畅地阅读。她的父亲也曾尝试教她算术,

    待学习
    开始阅读
  • 24

    第17章 噪声源,偏差是引人注目的图形,而噪声是不受我们关注的背景

    第17章 噪声源,偏差是引人注目的图形,而噪声是不受我们关注的背景 哪里有判断,哪里就有噪声,希望你现在也认同这一观点。我们也希望,对你而言这已不再是一件超乎想象的事。这也正是我们着手开展研究的主要动力。经过多年的努力,我们对这个问题的思考已经逐渐深入和完善。现在,来回顾一下我们已经了解的噪声成分、这些成分对噪声的重要影响以及它们在判断中所起的作用。 噪声成

    待学习
    开始阅读
  • 25

    第18章 卓越的判断者,卓越的判断力

    第18章 卓越的判断者,卓越的判断力 至目前为止,我们主要谈论的是人类的判断,而没有对不同的判断者进行区分。显然,在任何一项任务中,有些人做出的判断要优于其他人。即使是由群体做出的判断,如果该群体由高能力个体组成,那么最终的判断也会更优。这就引出了一个重要的问题,即如何甄别出更好的判断者。 有三件事至关重要。如果做判断的人受过良好的训练、更睿智且拥有正确的认

    待学习
    开始阅读
  • 26

    第19章 消除偏差与决策卫生

    第19章 消除偏差与决策卫生 许多研究人员和机构都力图减少判断偏差。在本章中,我们将分析他们的核心发现。我们将介绍消除偏差的各类干预措施之间的区别,并探讨其中一种值得进一步研究的干预措施。随后,我们将讨论如何减少噪声,并介绍决策卫生的概念。 干预:事后及事前消除偏差 减少偏差有两种主要方式,要描述它们的特点,一个好方法是回到测量类比。假设你家浴室里的体重秤在

    待学习
    开始阅读
  • 27

    第20章 司法科学,信息排序是最大的噪声

    第20章 司法科学,信息排序是最大的噪声 2004年3月,在西班牙首都马德里,一组被放置在通勤列车上的炸弹爆炸,造成192人死亡,2000多人受伤。人们在犯罪现场的塑料袋上发现了一枚指纹,并通过国际刑警组织将其传送到了世界各地的执法机构。几天后,美国联邦调查局(FBI)犯罪实验室最终确认这枚指纹属于一个居住在俄勒冈州的美国公民布兰登·梅菲尔德(Brandon

    待学习
    开始阅读
  • 28

    第21章 甄选与汇总,超级预测的两大策略

    第21章 甄选与汇总,超级预测的两大策略 许多判断都涉及预测,比如,下个季度的失业率可能是多少?明年将售出多少辆电动汽车?2050年的气候变化会带来什么影响?盖完一幢新楼需要多长时间?某家公司的年收入是多少?新员工会有什么样的表现?新的空气污染管理制度的成本是多少?谁将赢得选举?这些问题的答案会产生重大影响,因为私人机构和公共机构的一些重要选择往往取决于这些

    待学习
    开始阅读
  • 29

    第22章 医疗决策,用科学的诊断指南减少噪声

    第22章 医疗决策,用科学的诊断指南减少噪声 几年前,我们的一位好朋友保罗被他的主治医师琼斯诊断为患有高血压。琼斯医生建议保罗尝试药物治疗,他给保罗开了利尿剂,但保罗的血压依旧很高,也就是说药物没起到效果。几个星期后,琼斯又开了第二种药物——钙通道阻滞剂,但效果依然不理想。 这些结果使琼斯困惑不已。虽然过去的3个月保罗每星期都会来复诊,但他的血压只是略有下降

    待学习
    开始阅读
  • 30

    第23章 绩效评估,用基于外部视角的共识框架做出量化判断

    第23章 绩效评估,用基于外部视角的共识框架做出量化判断 让我们从一个练习开始:请选出3个你认识的人,他们可以是你的朋友或同事。请在友善、智慧和勤奋这3种特质上给他们进行1~5分的评分,其中1分是最低分,5分是最高分。现在再请另一个很了解他们的人(这个人可以是你的配偶、好友或者最亲密的同事)用同样的方式对这3个人进行评分。 在某些评估中,你和其他评分者很可能

    待学习
    开始阅读
  • 31

    第24章 人员招聘,以结构化指标衡量人才

    第24章 人员招聘,以结构化指标衡量人才 如果你曾经找过工作,那么“招聘面试”这个词可能会唤起你的一些生动而紧张的回忆。工作面试,即求职者与未来的主管或人力专员会面,是进入许多组织的必经之路。 在大多数情况下,面试遵循着既定的流程。在寒暄之后,面试官会要求应聘者描述他们的个人经历,或者详细地描述他们经历过的某些特定情形。再问一些诸如个人成就与挑战、工作动机以

    待学习
    开始阅读
  • 32

    第25章 中介评估法,做出明智决策的核心方法

    第25章 中介评估法,做出明智决策的核心方法 不久前,我们两个人(卡尼曼和西博尼)与我们的朋友丹·罗瓦洛(Dan Lovallo)一起,介绍过组织中使用的一种决策方法。这一方法的首要目的在于减少噪声,我们称之为中介评估法。该方法涵盖了我们前几章所介绍的大多数决策卫生策略,并且它的应用范围很广泛,只要在计划或选项的评估过程中需要考虑和权衡多维度信息,我们就可以

    待学习
    开始阅读
  • 33

    第26章 减少噪声的成本

    第26章 减少噪声的成本 每当我们建议人们消除噪声时,他们可能会以成本过高为由进行反对,并认为在极端情况下,减少噪声根本不可能。我们已经在商业、教育、政府以及其他领域听到过这种反对意见,这种观点虽然有一定的合理性,但言过其实了,或者只不过是一个借口。 为了证明我们的这种反对意见更有说服力,举一个高中老师为文章评分的例子。有位高中老师每星期都要对学生撰写的25

    待学习
    开始阅读
  • 34

    第27章 尊严,人之为人的重要价值观

    第27章 尊严,人之为人的重要价值观 设想如下三个场景:你申请房产抵押,但被拒绝,其原因并非有人实际考察了你的情况,而是因为银行有严格的规定,认为你这种信用等级的人不能申请房产抵押;你的条件很出色,而且一家公司的面试官也觉得你很不错,但你的求职申请被拒绝了,原因是15年前你曾被判刑,而该公司明令禁止录用任何有犯罪前科的人;你被判有罪,但不能被保释,这并非由于

    待学习
    开始阅读
  • 35

    第28章 规则还是标准

    第28章 规则还是标准 如果我们的目标是减少噪声和了解如何减少噪声(或在多大程度上减少噪声),那么我们就有必要区分两种约束行为的方式:规则和标准。很多组织通常会选择其中的一种,或将两者结合起来使用。 在商业领域,某家公司可能会有以下要求:员工必须在指定的时间内工作;每个人的休假时间不能超过两个星期;如果有人将公司的秘密泄露给媒体,那么他就会被解雇。我们也可以

    待学习
    开始阅读
  • 36

    回顾与总结 正视噪声问题

    回顾与总结 正视噪声问题 噪声是我们在做判断时不希望存在的变异,然而噪声实在太多了,本书的核心目标就在于解释为何会如此,以及我们应该如何应对噪声。本书涵盖的内容十分丰富,我们在这里仅从一个宽泛的视角来对书中的核心观点进行简要的回顾和总结。 判断不是计算,也无须遵循精确的规则 需要注意的是,不要把本书中的“判断”一词与“思考”一词混淆。判断是一个相对狭义的概念

    待学习
    开始阅读
  • 37

    结语 一个噪声很少的世界

    结语 一个噪声很少的世界 请想象一下,经过重新设计并减少了噪声的组织会是什么样子。医院、招聘委员会、经济预测机构、政府机构、保险公司、公共卫生机构、刑事司法系统、律师事务所和大学,都会对噪声问题保持警觉,并努力减少这些问题。噪声审查将会成为惯例,或许每年都能进行一次。 未来,组织的领导者将会在更多领域中使用算法来代替人类判断,或将其作为人类判断的补充。人们会

    待学习
    开始阅读
  • 38

    附录1 如何进行噪声审查

    附录1 如何进行噪声审查 附录1是一份关于如何进行噪声审查的实用指南。你可以以企业顾问的视角来阅读这部分内容,设想一下这家企业雇用你来对它的一个部门员工的专业决策进行噪声审查。 顾名思义,噪声审查的重点当然在于考察噪声的普遍性,然而,良好的噪声审查其实也能提供关于员工培训和工作监管中存在的偏差、盲点和缺陷的有价值信息。成功的审查有利于促进部门改革,包括改进专

    待学习
    开始阅读
  • 39

    附录2 决策观察者检查清单

    附录2 决策观察者检查清单 本附录给出了一份决策观察者(见第19章)检查清单的通用示例。这里提供的清单大致遵循做重要决策的时间顺序。 清单中每一项之后的参考问题都对相应的项目做了进一步说明。决策观察者在审视决策过程时应该问自己这些问题。 决策观察者不应照搬照抄这个清单。我们希望它发挥的作用是为决策观察者提供灵感和基准,并使决策观察者能够据此设计出适合自己的偏

    待学习
    开始阅读
  • 40

    附录3 对抗噪声,修正预测

    附录3 对抗噪声,修正预测 匹配性预测是我们依赖直觉式匹配过程而产生的错误(参见第14章)。当我们基于现有信息做预测时,我们会进行匹配性预测,就好像我们能够依据这些信息对结果做出完美的或准确率非常高的预测一样。 让我们来回顾一下朱莉的例子,她4岁就能流利地阅读,那么她在大学时的GPA会是多少呢?如果你预测朱莉在大学时的GPA是3.8,这就意味着你从直觉上判断

    待学习
    开始阅读
  • 41

    致谢

    我们要感谢很多人。林内亚·甘地(Linnea Gandhi)是我们的参谋长,她为我们提供了大量的指导和帮助,使我们的工作可以有条不紊地推进,让我们的工作充满欢声笑语。基本可以说,是她主持了本书的撰写。除此之外,她还为本书的初稿提出了许多宝贵建议,没有她,我们无法顺利完成本书。丹·罗瓦洛对成书也起到了非常重要的作用,本书的观点最初就源于他与人合著的一篇文章。我

    待学习
    开始阅读
  • 42

    译者后记

    汪祚军 中国科学院心理研究所博士,宁波大学教授 感谢编辑部独具慧眼,能够邀请中国科学院心理研究所李纾研究员领衔本书的翻译工作。李纾老师是国内最早从事行为决策研究的专家,在行为决策领域深耕数十年,其提出的“齐当别”决策模型在心理学界具有重要的影响力。作为行为决策领域的一名研究者、李纾老师曾经的博士生,能够参与本书的翻译工作,我深感荣幸。 在拿到本书的英文原书后

    待学习
    开始阅读
  • 43

    注释

    引言 偏差与噪声,人类判断的两类错误 射击场只是一种隐喻:1778年,瑞士数学家丹尼尔·伯努利(Daniel Bernoulli)在一篇关于评估问题的论文中使用弓和箭进行了相同的类比。Bernoulli, “The Most Probable Choice Between Several Discrepant Observations and the For

    待学习
    开始阅读

Local EPUB Text

回顾与总结 正视噪声问题

回顾与总结

正视噪声问题

噪声是我们在做判断时不希望存在的变异,然而噪声实在太多了,本书的核心目标就在于解释为何会如此,以及我们应该如何应对噪声。本书涵盖的内容十分丰富,我们在这里仅从一个宽泛的视角来对书中的核心观点进行简要的回顾和总结。

判断不是计算,也无须遵循精确的规则

需要注意的是,不要把本书中的“判断”一词与“思考”一词混淆。判断是一个相对狭义的概念,指的是以人的大脑为工具的测量。与其他测量方式一样,判断需要为一个对象赋值,不过这个值未必是数字。例如“玛丽的肿瘤可能是良性的”是判断,“国民经济不稳定”“弗雷德是我们新任经理的最佳人选”“这种程度的风险所对应的保费应该是12 000美元”等,这些也都是判断。判断是将各种信息非正式地整合到总体评估中,但判断不是计算,也无须遵循精确的规则。教师可以用判断来对论文进行评分,但不能用判断做多项选择题。

很多人以专业判断为生,每个人都可能在一些很重要的方面受到这些专业判断的影响,我们所说的专业判断者,包括足球教练、心脏病专家、律师、工程师、好莱坞高管和核保员等。专业判断是贯穿本书始终的重点,这不仅是因为它们已经被广泛研究,还因为这些判断的品质会对我们所有人产生巨大影响。此外,我们相信我们所学到的知识也同样适用于生活中其他方面的判断。

有些判断具有预测性,并且有些预测性判断是可验证的,即我们最终会知道它们是否准确,短期预测大都属于此类,例如药物的疗效、流行病的传播过程以及选举的结果等。但是,有些判断是无法验证的,如长时间跨度的预测和对虚拟问题的回答,对于这些判断,我们只能通过评估产生这些判断的思维过程来评估其品质。此外,还有一些判断并非可预测的,而是可评估的,举例来说,法官的判决或一幅画在有奖竞赛中的排名,就不太容易与其客观的公正判决或这幅画的真实价值进行比较。

然而,令人惊讶的是,无论是否存在真实值,判断者都会表现得像存在真实值一样,他们的思考及行为就像是要瞄准一个看不见的靶心,并且希望不要偏离靶心太多。“见仁见智的判断”一词表明,判断可能存在分歧,但分歧是有限度的。判断的一个重要特征是存在有限的分歧。判断介于计算和独特的个人品位之间,计算意味着不允许存在任何分歧,而个人品位则意味着,除非处在极端情况中,人们完全不期望能够达成一致。

人类判断的错误:偏差和噪声

当一组判断中的大部分错误都指向同一个方向时,我们就认为这组判断出现了偏差,偏差即平均误差。例如,整队射击手连续命中靶子的左下方;公司高管年复一年地对销售额做出过高的估计;公司对本该撤销的失败项目持续进行投资。这些都是偏差。

消除一系列判断中的偏差并不能消除所有误差,消除偏差后仍然残留的误差缺少共性(12)。它们是我们在做判断的过程中不希望存在的分歧,体现了我们将测量工具应用于实际时的不稳定性。这种变异就是噪声。噪声是本该相同的判断中出现的变异。我们用“系统噪声”这一术语来描述组织中具有同质性的专业人士,如急诊医生、量刑法官以及保险公司核保员在做决策时出现的噪声。本书的大部分内容都在讨论系统噪声的问题。

测量偏差和噪声

均方误差(MSE)是科学测量学中已经沿用了近200年的测量准确性的标准。均方误差的主要特征是:它将样本均值作为总体均值的无偏估计,同等对待正误差和负误差,并且不成比例地处理较大的误差,因此,均方误差不能反映判断误差的实际代价——误差的实际代价往往是非对称的。然而,专业决策往往需要做出准确的预测。对于一个即将面临飓风袭击的城市,低估和高估飓风威胁所需付出的代价显然是非对称的,但你不希望这些代价影响气象学家对风暴速度和轨迹的预测。对于此类以追求客观准确性为目的的预测性判断来说,均方误差是合适的判断标准。

偏差和噪声都可以用均方误差来独立测量,而它们都是误差的来源。显然,偏差通常是有害的,减小偏差总是能提高判断的准确性;而噪声同样有害,减少噪声也同样总是能提升判断力。但是从直觉上说,这一事实却不那么容易被大家接受,人们通常希望,即使判断中存在明显偏差,离散度也最好为0。当然,我们最终的目标是同时使偏差和噪声最小化。

一系列可验证的判断中的偏差指的是案例的平均判断与其真实值之间的差异。而对于无法验证的判断,则无法进行这种比较。例如,承保人为特定风险设定的保费,其真实值永远不可知。对于某项特定罪行来说,我们也无法轻易知道公正判决的真实值是什么。在缺乏真实值的情况下,一个最常用、最方便(虽然并非总是正确)的假设是:判断是不偏不倚的,多名法官的平均值就是对真实值的最佳估计。

我们可以通过噪声审查来评估系统中的噪声。在噪声审查过程中,几名专业人员对同一案例(真实的或虚构的)做出独立判断,我们可以在不知道真实值的情况下测量噪声,就像我们从靶子背面看到一堆弹孔的分布图一样。噪声审查可以衡量许多系统中判断的变异性,包括放射科和刑事司法制度,有时还会让人们关注到技能或训练的不足。此外,噪声审查还可以对系统噪声进行量化,例如同一团队中的核保员对风险的评估有所不同的情形。

偏差和噪声哪个问题更大呢?这要依据实际情况而定,答案很可能是噪声。当误差的平均值(偏差)与误差的标准差(噪声)相等时,偏差和噪声对总体误差的贡献相同。如果判断呈正态分布,即标准钟形曲线,那么只有当84%的判断都高于或低于真实值时,偏差和噪声的影响才相等。这其实是很大的偏差,这么大的偏差很容易就能被专业人员检测到。而当偏差小于一个标准差时,噪声就是总误差中更大的错误来源了。

噪声是个问题,远超我们的想象

分歧在某些判断场景中是没有问题的,甚至是有必要的。观点的多样性对于激发创意和产生多种设想必不可少,标新立异的思维对于创新也至关重要。比如,电影评论家多元化的观点是优势而非劣势;交易员之间的分歧促进了市场的繁荣;相互竞争的创业公司之间的战略差异使市场能够优胜劣汰。但是,在我们所讨论的判断问题上,系统噪声永远是一个问题,如果两位医生给你做出了不同的诊断,那么其中至少有一种诊断是错误的。

系统噪声的绝对数量及其造成的破坏程度之大令人震惊,这也正是我们撰写本书的动力所在。两者都远远超出了我们的预期。我们在本书中提及了商业、医学、刑事司法、指纹分析、天气预报、绩效考核和政治等许多领域的案例,并从中得出了结论:哪里有判断,哪里就有噪声,而且其数量之大远超我们的想象。

噪声在误差中的重大作用与人们普遍拥有的一种观念相悖,即“随机误差不重要”,因为他们可以“相互抵消”。然而,这种观念是错误的,如果靶心周围散布着很多弹孔,那么说“平均下来射击手击中了靶心”是毫无意义的。如果一名应聘者的得分高于他的实际水平,而另一名应聘者的得分低于他的实际水平,则可能导致用人单位聘错人。如果一份保单的保费过高,而另一份保单的保费过低,这两种错误对保险公司而言都是代价高昂的:前一种情况可能会使公司丢了生意,后一种情况则会使公司赔钱。

简而言之,如果缺少正当的、导致判断差异性过大的理由,那么判断过程一定存在误差。而且,即使我们无法对判断进行验证以及对误差进行测量,噪声也是有害的。“同罪不同罚”是不公平的,在一个系统中,如果相关人员的专业判断缺乏一致性,那么这个系统就会失去公信力。

水平、模式、情境,噪声的3种类型

系统噪声可分为水平噪声和模式噪声。有些法官通常很严厉,而另一些法官则更宽容;一些股票预测者总是预测牛市,另一些则总是预测熊市;有些医生开的抗生素比其他医生多。水平噪声是不同个体平均判断上的变异性,判断量表的模糊性是水平噪声的来源之一。像“可能”这样的词或“0~6分量表中的4分”这样的数字对不同的人来说含义是不同的。水平噪声是判断系统中的误差的重要来源,也是减少噪声过程中的一个重要干预对象。

系统噪声还包含另一种成分,这种成分通常占比更大。无论判决的平均水平如何,不同的法官对于哪种罪行应受更严厉的刑罚的看法可能有所不同。法官们的不同判决会导致对不同案件的排序不同。我们称这种变异为模式噪声[统计术语为“统计交互作用”(statistical interaction)]。

模式噪声的主要来源是稳定的,如不同法官对同一案件所做出的个体化、特异性的反应。其中一些差异反映了个体(有意识或无意识)遵循的原则或价值观。例如,一位法官对偷盗者可能特别严厉,而对违反交通法规的人则较宽容;另一位法官可能刚好相反。某些潜在的原则或价值观可能非常复杂,而判断者可能对此毫无意识。例如,某位法官可能对年龄较大的偷盗者比较宽容,他自己却完全没有意识到这一点。同时,对特定案例高度个体化的反应也可能是稳定的,比如,某位法官由于觉得被告长得像自己的孩子,从而对被告产生了怜悯之情,并对被告予以宽大处理。这位法官在不同时间里遇到这种情况,他都会如此。

这种稳定的模式噪声反映了法官的独特性:他们对案件的反应与他们独一无二的人格特征一样。人与人之间的细微差异通常很微妙也很有趣,但是,在需要一致性判断的系统中,这种由专业人员做出的判断间的差异是有问题的。在我们所考察的研究中,这种因个体差异而产生的稳定的模式噪声通常是系统噪声的最大来源。

尽管如此,法官对特定案件的不同态度也不完全是稳定的,也就是说模式噪声也包含一个可变成分,我们称之为情境噪声。如果放射科医生在不同的日子里对同一张影像片子做出了不同的诊断,或是指纹鉴定师有时认为两个指纹是匹配的,有时则认为是不匹配的,我们就能在其中检测到情境噪声。正如上述例子所示,如果判断者没能识别出某个案例是他以前处理过的案例,我们很容易在他做判断的过程中测量出情境噪声。另一种证明存在情境噪声的方式是发现与判断无关的背景因素对判断产生了影响。例如,当法官最喜欢的足球队获胜后,他们变得较宽容;医生在下午通常会开出更多的阿片类药物。

判断与噪声的心理机制

判断者的认知缺陷并非预测性判断中存在误差的唯一原因,客观无知往往起着更大的作用。实际上,有些事确实是不可知的,例如,新生的婴儿中,有多少人会在70年后抱上孙子;明年开奖的彩票,其中奖号码是多少。还有一些信息也许是可知的,但判断者并不知道。人们往往会在做出预测性判断的过程中表现得过度自信,低估了他们的客观无知和偏差。

我们预测的准确性是有限的,而且这个限度通常很低,尽管如此,我们还是对自己的判断感到满意。这种令人满意的信心来自内部信号,即当事实和判断匹配成连贯的故事时自发产生的奖励,然而,我们对判断的主观信心未必与其客观准确度有关。

大多数人在得知自己的预测性判断准确度很低甚至不如公式时,都会很惊讶。然而事实上,即使是建立在有限数据上的简单线性模型或在信封背面就能写得下的简单规则,也常常胜过人类的判断,规则和模型的关键优势在于它们没有噪声。正如我们主观体验到的那样,判断是一个微妙而复杂的过程。这样说并非想要表明这种微妙之处大部分是噪声,而是说我们很难想象,盲目地遵守简单的规则都比人类自己做出判断更准确,但这的确是事实。

心理偏差显然是导致系统误差或统计偏差的来源之一,尽管没那么明显,心理偏差也是噪声的来源之一。如果并非所有判断者都共享同样的偏差,或他们产生偏差的程度各不相同,抑或偏差的影响取决于外部环境,那么此时心理偏差就会产生噪声。例如,如果一半的经理在做招聘决策时对女性存在歧视,而另一半经理又偏好录用女性,则整体上不会有偏差,但系统性噪声会导致许多招聘错误。另一个例子是第一印象效应,这是一种心理偏差,但如果证据的呈现顺序是随机的,这种偏差就可能产生情境噪声。

我们将判断过程描述为:非正式地对一系列线索进行整合,并在一个量尺上做出判断的过程。因此,消除系统性噪声需要判断者在线索的使用、给线索赋予权重以及使用量尺上保持一致。即使不考虑情境噪声的随机影响,这些要求也很难满足。

在单一维度的判断中,人们判断的一致性通常很高,比如两个候选人中哪个更具魅力或哪个更勤奋,不同的招聘者往往能在这类评价性问题上达成共识。人们共有的对不同维度进行匹配的直觉过程让人们足够产生相似的判断,如人们将高GPA与超前的阅读能力相匹配。如果一个判断中只有少量线索,并且这些线索基本都指向同一个方向,那么人们也容易在这样的判断上达成一致。

当判断需要对多个彼此冲突的线索赋予一定的权重时,巨大的个体差异就会产生。对于同一位候选人,有些面试官会更重视才华或个人魅力,有些面试官则可能更看重勤奋或抗压能力。当线索不一致并且不能构成连贯的故事时,不同的人在重视哪些线索和忽略哪些线索上必然会表现不同,这就会产生模式噪声。

不易觉察的噪声

噪声不容易被人觉察,也很少被讨论,而且显然比偏差更少受到关注,因此你可能没怎么考虑过它。不过,噪声如此重要,却不容易被人觉察,这本身也是一种非常有趣的现象。

认知偏差以及其他情感或动机对思维的扭曲,常被用来解释糟糕的判断。分析人士用过度自信、锚定效应、损失厌恶、可得性偏差(availability bias)以及其他种类的偏差来解释那些糟糕的决策。基于偏差的解释常常令人满意,因为人类思维渴望因果性解释。每当出现问题时,我们都会去寻找原因,通常情况下我们也确实能够找到原因。在一些情况下,偏差看起来就像是不良决策的成因。

偏差在解释性方面颇具魅力,噪声却缺乏这种魅力。如果试图事后解释为什么某个特定的决定是错误的,那么我们可能很容易发现偏差,但不会发现任何噪声。只有用统计思维来看待世界,我们才会看到噪声,但这种统计思维并非与生俱来,因为我们往往更喜欢因果性的故事。我们的直觉系统缺乏统计思维,这就是噪声比偏差更少受到关注的原因之一。

另一个原因在于,专业人士很少认为自己和同事的判断会有噪声。经过一段时间的培训后,他们通常会自行做出判断。指纹专家、经验丰富的核保员和资深专利审核员几乎不会去想其他同事会与自己的意见不一致,他们更不会去想,其他同事会如何质疑自己的意见。

大多数时候,专业人士会对自己的判断充满信心。他们总以为自己的同事会赞同自己的意见,却从来不会去弄清楚是否的确如此。在大多数领域,人们做出判断后永远不会将其与真实值进行比较,最多是让另一位尊重型专家对其判断进行审查。专业人士之间偶尔才会出现大到令人惊讶的分歧,而且一旦出现这种分歧,他们通常会找到理由来将其视为极端案例。组织程序也倾向于忽略或压制专家之间的分歧,这是可以理解的,毕竟站在组织的立场上,噪声是一种令人尴尬的存在。

决策卫生的6个原则

我们有理由相信,有些人的判断就是比其他人好。最佳判断者具有如下特征:拥有与任务相关的技能、智力以及特定的认知风格——用积极开放性思维来形容这种认知风格最为恰当。毫无疑问,优秀的判断者犯严重错误的情况很少。然而,鉴于导致个体差异的因素众多,即使是最好的判断者,我们也不应该奢望他们能够在复杂的判决任务中达成完美的一致性。背景、个性和经历的千差万别使得我们每个人都与众不同,这也是我们无法避免噪声的原因。

消除偏差是减少误差的一种策略。通常,人们要么在事前控制偏差的影响,要么在事后对偏差进行校正。我们提出第三种方案,它特别适用于团队决策:指定一位决策观察者来识别偏差出现的迹象,从而对偏差进行实时检测(参见附录2)。

对于降低判断中的噪声,我们的主要建议是采取决策卫生策略。我们之所以选择“决策卫生”这个词,是因为减少噪声就像平常的卫生习惯一样,是为了预防未知的敌人。例如,洗手可防止未知病原体进入身体。同理,决策卫生可以防止未知的错误出现。决策卫生与它的名字一样乏味,远不如战胜可预测性偏差那样令人振奋,预防未知损害可能也得不到什么荣誉,但依然值得我们这么做。

组织中的减少噪声的工作也应该从噪声审查开始(参见附录1)。噪声审查的一项重要功能是使组织由衷地认真对待噪声。这将有利于对不同类型的噪声进行评估。

在前文中,我们描述了不同领域中减少噪声工作的成效与局限。现在,我们简单总结一下决策卫生策略的6项原则,描述它们如何解决引发噪声的心理机制并展示它们如何与特定的决策卫生策略之间建立联系。

原则1:判断的目的在于准确性,而不在于个性化表达。这是判断中必须遵循的首要决策卫生策略,它反映了本书对判断一词狭义、具体的定义。我们发现,稳定的模式噪声是系统噪声中很大的组成部分,它是个体差异以及“判断人格”的直接结果,判断人格会导致不同人在面对同一问题时持不同观点。基于这些发现,我们得出一个不受欢迎但又无法忽视的结论——做判断不是表达个性的场景。

需要明确的是,个人的价值观、个性和创造力在思考与决策的许多阶段都是重要的,甚至是必要的,包括目标选择、形成解决问题的新方案以及生成选项。但在对这些选项做出判断时,个性化的表达就成了一种噪声源。如果判断是为了达到准确性,且你希望其他人认同你的判断,那么你就需要换位思考:如果其他称职的判断者处于你的位置,他们会怎么想。

遵循这一原则的一种比较激进的方法是用规则或算法来代替判断。用算法做评估可以保证消除噪声——实际上,它是完全消除噪声的唯一方法。算法已在很多重要领域中得到应用,并且越来越受到重视,但是,在重要决策的最终阶段,算法不太可能取代人类判断——我们认为这是件好事情。但是,适当地使用算法或至少让决策不那么依赖于专业人士的个人喜好,可以改善判断。例如,我们已经看到了,决策指南可以有效地限制法官的自由裁量权、提升医生诊断的一致性,进而减少噪声和提升决策品质。

原则2:使用统计思维,采用外部视角审视个案。当判断者将某个案例视为一系列相似案例中的一例而不是把它看作特例时,我们就说,这个判断者采用了外部视角。这种方法不同于常规思维模式,即只关注当前案例,并将其纳入因果性故事中。当人们基于自身独特的经历来形成对特定事件的独特看法时,其结果就是会产生模式噪声。外部视角可以解决这一问题:具有相同参照系的专业人员会有更少的噪声,此外,外部视角也有助于产生有价值的见解。

外部视角原则倾向于将预测锚定在一群类似案例的统计特征上。它也提示我们,预测应该是适中的——更技术性的术语是回归(参见附录3)。关注到以往结果的广泛分布及其有限的可预测性,有助于决策者调整自己的判断信心。人们不能因为在不可预测的事情上做出了错误的预测而遭受责备,但如果错误是由于他们在预测时过度自信,那么他们就应该受到责备。

原则3:对判断进行结构化,将其分解成几个独立的任务。这一“分而治之”的原则对于解决我们称之为过度一致性的心理机制所产生的影响是很有必要的。过度一致性会使人们曲解或忽略那些与已有结论或刚刚出现的故事不相符的信息。当同一案例的不同方面所产生的印象相互“污染”时,判断在总体上的准确性就会受到影响。比如,如果允许证人之间互相交流,你认为他们提供的证词还有多少价值呢?

人们可以通过将判断问题分解为一系列的小任务来减少过度一致性问题。这项技术与结构化访谈的原理类似。在结构化访谈中,访谈员一次只评估一个特征,即给前一个特征评完分之后,再对下一个特征进行评分。结构化原则对一些医学诊断指南具有启发意义,例如针对新生儿的阿普加评分,该原则也是我们提过的中介评估法的核心。中介评估法将一个复杂的判断分解为多个基于事实的评估,其目的在于保障每个评估都是独立进行的。因此,尽可能将每个评估分配给不同的团队,并尽量减少他们之间的沟通,这样能确保每个评估的独立性。

原则4:抵制不成熟的直觉。我们介绍了完成判断时的内部信号,它赋予了决策者判断的信心。决策者不愿意放弃这种奖赏性的内部信号,这也是他们不愿意使用指南、算法或者其他束手束脚的规则的主要原因。显然,决策者需要对他们的最终决策感到满意,并从直觉的自信中获得回报感,但是他们不应该过早地给予自己这种回报感。通过对信息的权衡和仔细思考而得出的直觉决策远胜于快速判断,因此不必禁用直觉,但直觉应该建立在一定信息的基础上,且应该接受规则的约束与适当的延迟处理。

这一原则启发我们对信息进行排序:不应给做判断的专家呈现他们不需要的以及可能引发偏差的信息,即使这些信息是正确的。例如,在司法科学中,最好不要让检查员知道有关犯罪嫌疑人的其他信息。中介评估法的一个关键要素——控制讨论议程也是如此,一个有效的讨论议程将确保人们分别从不同的方面考虑问题,直到所有方面的评估都完成之后,人们再做出整体判断。

原则5:获取多位判断者的独立判断,再考虑汇总这些判断。很多组织的常规流程违反了独立性原则,尤其是一些会议流程会导致参与者的意见受到他人的影响。由于信息级联和群体极化效应,群体讨论通常会放大噪声。在讨论之前收集参与者的判断,这样一个简单的流程既可以揭示噪声的程度,又有助于以建设性的方式解决分歧。

对所有的独立判断求均值可确保减少系统噪声,但不能减少偏差。单一判断是从所有可能判断的总体中抽取的一个样本,增加样本量可以提高估算的准确性。当判断者具有多样化的技能以及互补的判断模式时,求均值的优势会进一步增强。对一系列充满噪声的判断进行平均,其结果可能比全体一致的判断更为准确。

原则6:用相对判断和相对量表会更好。相对判断的噪声要比绝对判断的噪声小,因为我们在同一量表上对多个对象进行归类的能力是有限的,但是我们对众多对象进行两两比较的能力却更胜一筹。基于比较的判断量表要比需要绝对判断的量表噪声更少,例如,我们可以用每个人都熟悉的案例作为一把案例量表,判断者们只需要确定某起案件在量表上的相对位置即可。

我们刚刚列举的决策卫生原则不仅适用于重复性决策,也适用于单次的重大决策,即我们所谓的单一决策。单一决策中会存在噪声,这似乎与我们的直觉相悖:从定义上来看,如果你仅做一次决策,就没有可以测量的变异,也就是说不应存在噪声,但是噪声的确存在,而且会导致误差。如果我们只看到第一个射击手的射击情况,那么整个队伍的噪声是看不见的,但是当我们看到所有射击手的射击情况后,整个队伍的射击分布就变得清晰了。同样,考量单一决策的最佳方法是将其视为仅进行了一次的重复性决策。这就是决策卫生策略也能改善单一决策的原因。

强制采用决策卫生策略可能会费力不讨好。噪声是隐形的敌人,战胜隐形的敌人也只能取得隐形的胜利,但是,就像保持身体健康需要讲卫生一样,决策卫生至关重要。一位患者的手术成功后,你会相信这是外科医生的妙手回春挽救了患者的生命,但如果外科医生和手术室中的其他人员都没有洗手,这位患者可能已经一命呜呼了。做好杀菌消毒工作可能没有什么值得炫耀的,却会产生实实在在的好处。

噪声是隐形的敌人,我们应该重视这个敌人

当然,与噪声做斗争并不是决策者和组织要考虑的唯一因素。减少噪声的成本可能太高了:一所高中可以要求更多的老师来阅读每篇作文,从而消除评分中的噪声,但是这种额外的工作量是没必要的。实践中不可避免地会有一些噪声产生,这是给予每一个案例个别化考虑的系统必然产生的副产品,它使得人们不像机器的齿轮,并确保了决策者的主观能动性。有些噪声甚至是人们所期待的,前提是它产生的变异有利于系统适应时代的变化,比如噪声反映了社会不断变化的价值观和目标,以及引发了能导致实践或司法变革的讨论。

也许其中最值得重视的是,降噪策略导致了令人无法接受的不良后果。许多有关算法的担忧实际上是被夸大了,但有一些担忧是合理的。即使算法可以成功地避免人类会犯的很多错误,它们也可能会犯人类永远不会犯的愚蠢错误,并因此失去可信度。算法也可能会因为设计不当或训练数据选取不当而产生偏差。另外,算法的模糊性也可能会引起人们的不信任。决策卫生在实践中也有其弊端:如果管理不善,它就会产生决策官僚化的风险,专业人士也可能因为自己的自主权受损而士气低落。

所有这些风险和局限性都应该得到充分考虑。不过,拒绝减少噪声的理由是否合理,取决于你所考虑的减少噪声策略具体是什么。拒绝汇总判断的理由,如成本太高或许不适用于拒绝使用指南。可以肯定的是,一旦减少噪声的成本超过其收益,就不应该再执着于减少噪声了。一旦进行成本收益分析,或许就能找到一个非零的最佳噪声水平。问题在于,在没有进行噪声审查的情况下,人们意识不到判断中包含了多少噪声,在这种情况下讨论减少噪声的难度,只不过是为不想测量噪声而找借口而已。

偏差会导致误差和不公,噪声也是如此,但我们在这方面所做的研究很少。相比于将判断误差归结为因果,当将判断误差归结为随机性因素时,人们对判断误差的容忍度更高,但这并不意味着随机性因素带来的判断错误的危害更小。若想在重大决策上做得更好,我们就应该认真对待减少噪声问题。