学习进度

0%

阅读时长

未满 1 分钟

最近阅读:未开始阅读

核心概念

待提炼

章节学习

  • 1

    献词

    献给诺加、奥里和吉利 ——丹尼尔·卡尼曼 献给范丁和莱莉亚 ——奥利维耶·西博尼 献给萨曼莎 ——卡斯·R.桑斯坦

    待学习
    开始阅读
  • 2

    重磅赞誉

    从“偏差”到“噪声”,作为心理学家的卡尼曼,挑战的是经济学的“理性人”假设,并因开启了行为经济学的大门而获得诺贝尔经济学奖。他一直关注的是人类在决策中是如何犯错的,在这本书中,他深入分析了噪声的影响,但也乐观地预期,可以通过发掘埋没在大数据中的信息来减少决策中的噪声,这可以说是大数据渗透到行为经济学领域的新趋势。 巴曙松 北京大学汇丰金融研究院执行院长,中国

    待学习
    开始阅读
  • 3

    测一测 如何做一个聪明的决策者?

    测一测 如何做一个聪明的决策者? 想知道你的判断 是怎么掉入噪声陷阱的吗? 扫码测一测, 立即获取答案及解析, 看看你的“降噪等级”。 1.卡尼曼是世界上第一个凭借心理学研究获得诺贝尔经济学奖的人。这个说法对吗? A.对 B.不对 2.卡尼曼指出:人类判断出错的原因有两种。一种是偏差,另一种是什么呢? A.误差 B.噪声 C.系统认知 3.在做一个判断时,以

    待学习
    开始阅读
  • 4

    推荐序1 在无法回避噪声的世界,更好地追求高级境界与极致效益

    推荐序1 Preface 在无法回避噪声的世界, 更好地追求高级境界与极致效益 彭凯平 清华大学社会科学学院院长 每年七八月份,我都会参加清华大学的本科生招生工作,由此而目睹了一个问题:高考揭榜之后,高中毕业生及其家长应如何做好志愿填报?学校和专业的选择非常重要,很有可能会决定一个学生一辈子的命运,其中牵涉的问题就与我们心理学中一个重要的研究领域紧密相关,那

    待学习
    开始阅读
  • 5

    推荐序2 穿越噪声的决策

    推荐序2 Preface 穿越噪声的决策 朱宁 上海交通大学上海高级金融学院金融学教授,副院长 我抱着浓厚的兴趣读完了诺贝尔经济学奖得主丹尼尔·卡尼曼教授等的新作《噪声》一书,这本书汇集了卡尼曼教授近十年的最新发现。对于我所从事的行为金融学研究领域而言,《噪声》算得上是一本“专业书”,但是读完之后,我认为它很可能是卡尼曼教授继《思考,快与慢》后,又一次成功将

    待学习
    开始阅读
  • 6

    中文版序 哪里有判断,哪里就有噪声

    中文版序 Preface 哪里有判断,哪里就有噪声 我们非常荣幸,也非常感激,能够在中国出版这本书。《噪声》重点关注人类的判断,关注它是如何出错的,以及如何让它变得更好。无论是医学、法律、公共政策、商业,还是日常生活领域中,我们做出判断的过程中存在的问题,是偏好根据经验做判断的人类的共性问题。 数十年来,偏差问题备受瞩目。在《思考,快与慢》一书中,本书的作者

    待学习
    开始阅读
  • 7

    引言 偏差与噪声,人类判断的两类错误

    引言 Introduction 偏差与噪声,人类判断的两类错误 试想一下,你的朋友组成了A、B、C、D共4支队伍,来到一个射击场。每队中有5个人,他们共用一支来复枪,且每人只开了一枪。图0-1显示了他们的射击结果。 图0-1 4支队伍的射击结果 理想情况是,每一枪都能正中靶心。 A队几乎达到了理想情况,他们的每一发子弹都紧紧围绕着靶心,接近完美模式。 B队的

    待学习
    开始阅读
  • 8

    第1章 犯罪和充满噪声的判罚

    第1章 犯罪和充满噪声的判罚 假设某人被指控犯了罪,例如到商店行窃、私藏海洛因、袭击他人或持枪抢劫,该案件可能的判决结果是什么? 答案不应取决于该案件恰巧被指派给哪位法官、天气是冷是热,以及当地球队在前一天是输是赢。如果3个背景类似的人被指控犯有同一罪行,最后却得到截然不同的处罚,例如第一个人被判缓刑,第二个人被判2年有期徒刑,最后一个人被判10年有期徒刑,

    待学习
    开始阅读
  • 9

    第2章 系统噪声,给人达成一致的错觉

    第2章 系统噪声,给人达成一致的错觉 我们最初接触噪声,并对这个主题产生兴趣,并不是因为遇到了像刑事司法案件那般富有戏剧性的案例。实际上,这次邂逅纯属偶然,缘于一家保险公司,这家公司与我们中的两人所属的咨询公司有合作。我们的研究揭示了营利性组织中存在噪声问题的严重性——组织会因为决策中的噪声损失惨重。我们在保险公司的经历有助于解释为什么噪声问题常常被忽视,以

    待学习
    开始阅读
  • 10

    第3章 单一决策,仅发生一次的重复决策

    第3章 单一决策,仅发生一次的重复决策 到目前为止,我们所讨论的案例研究都与重复决策相关。比如,对盗窃犯的恰当判决是什么?对某一特定风险该收取多少保费?虽然每个具体的案例在某种意义上都是独特的,但像这样的判断属于重复决策。医生诊断患者,法官审理假释案件,招生人员审查入学申请书,会计师准备税单等,这些都是重复决策。 正如前一章所介绍的,重复决策中的噪声可以通过

    待学习
    开始阅读
  • 11

    第4章 什么是判断

    第4章 什么是判断 本书论述的是一般意义上的专业判断,我们假设如果做判断的人有足够的能力,就能做出准确的判断。然而,判断这一概念本身包含着一个你不得不承认的事实:你永远无法确定一个判断是不是准确。 请思考“判断问题”和“主观判断”这两个短语的差别。我们认为“太阳明天会升起”或“NaCl是氯化钠的化学式”这样的陈述并非判断,因为任何理性的人都会完全同意上述观点

    待学习
    开始阅读
  • 12

    第5章 测量误差,噪声与偏差的代价一样大

    第5章 测量误差,噪声与偏差的代价一样大 显而易见的是,一致性的偏差会引发代价高昂的错误。如果体重秤在你每次称体重时都自动加上一定的重量,如果一位乐观的经理总是预测项目只需花费实际所需时间的一半,如果一位谨小慎微的经理总是年复一年地低估未来的销售额,那么后果都将会非常严重。 我们已经知道,噪声会引发代价高昂的错误。如果一位经理大多数时候预测的项目所需时间只是

    待学习
    开始阅读
  • 13

    第6章 噪声分析:所有判断都存在3类噪声

    第6章 噪声分析:所有判断都存在3类噪声 在上一章,我们讨论了单个案例中测量或判断的变异性。在单个案例中,判断的所有变异性都是误差,而误差由偏差和噪声组成。我们考察的判断系统,包括法院和保险公司的判断系统,它们的目的在于处理不同案例,并对这些案例进行区分。如果美国的联邦法官和保险理赔员对他们手头的所有案例都做出相同的判断,那他们就没有什么存在的价值了。对不同

    待学习
    开始阅读
  • 14

    第7章 情境噪声,无时无刻不在影响着我们的判断

    第7章 情境噪声,无时无刻不在影响着我们的判断 想象一名职业篮球运动员正在准备罚球的场景:他站在罚球线上,全神贯注地准备投篮。这是他练习过无数次的一系列动作,他能投中吗?我们无法预知结果。 在NBA的比赛中,球员们通常能够4罚3中。显然,一些球员比其他球员表现得更好,但没有人能做到百发百中(3)。虽然篮筐一直都是距离地面3.05米,与罚球线的垂直距离一直是4

    待学习
    开始阅读
  • 15

    第8章 群体是如何放大噪声的

    第8章 群体是如何放大噪声的 个体判断中存在噪声的结果已经很糟糕了,但群体决策中的噪声危害更甚。群体决策可能会由于一些无关因素而朝任何一个方向改变。谁先发言、谁后发言,谁说话更自信,谁穿着黑色衣服,谁和谁挨着坐,谁在某个时刻笑了/皱眉了/呈现出其他身体姿势……所有这些因素都会影响结果。相似的群体每一天都会做出各种不同的决策,如雇用、晋升、破产、沟通策略、环境

    待学习
    开始阅读
  • 16

    第9章 判断与模型,简单的模型普遍优于人类判断

    第9章 判断与模型,简单的模型普遍优于人类判断 很多人都对预测未来的工作绩效感兴趣,不只是自己的,还有别人的。因此,绩效预测是用来考察预测性判断的实用例子。例如,一家大公司在招聘高管时,聘请了一家专业咨询公司对两名候选人莫妮卡和娜塔莉进行评估,并以取值为1~10分的量表对两人的领导力、沟通能力、人际交往能力、职业技能、应聘动机等维度进行打分(见表9-1)。你

    待学习
    开始阅读
  • 17

    第10章 无噪声的规则

    第10章 无噪声的规则 近年来,人工智能(Artificial Intelligence)特别是机器学习技术让机器能够执行许多以前只有人类才能执行的任务。机器学习算法可以承担人脸识别、语言翻译、分析医学影像等任务,并且可以以惊人的速度和准确性来处理计算问题,例如为成千上万名驾驶员迅速规划行车路线。它们还可以执行困难的预测任务:预测美国最高法院的判决;识别哪些

    待学习
    开始阅读
  • 18

    第11章 哪里有预测,哪里就有客观无知

    第11章 哪里有预测,哪里就有客观无知 我们经常同一些公司高管分享第9章和第10章中的研究内容,并通过发人深省的发现让他们意识到人类的判断是有限的。这些发现已经存在了半个多世纪,应该很少有人能避开它们,但人们仍然对这些发现很抵触。 在我们的听众里,有一些高管会很自豪地告诉我们,相比于定量分析,他们更相信自己的直觉;其他人虽然没明说,但他们也有同样的看法。有关

    待学习
    开始阅读
  • 19

    第12章 常态谷:事情虽无法预测,但可以被理解

    第12章 常态谷:事情虽无法预测,但可以被理解 现在我们来考虑一个更大的问题:在这个世界上,有些问题容易解决,有些问题却充满了客观无知,那我们应如何自处呢?毕竟,在存在很严重的客观无知的情况下,我们很快就能意识到,用水晶球来预测未来是徒劳的,但我们通常并不会对这个世界产生这种体验。相反,正如上一章所提到的,我们一直在基于少量的有用信息来对未来做出大胆预测。在

    待学习
    开始阅读
  • 20

    第13章 启发式、偏差与噪声

    第13章 启发式、偏差与噪声 本书是对横跨半个世纪的关于人类直觉判断研究的延续,也就是所谓的“启发式和偏差研究项目”(heuristics and biases program)。《思考,快与慢》一书对该研究项目前40年的研究内容进行了回顾,探讨了能够解释“直觉思维的奇妙与缺陷”的心理机制。该项目的核心思想是,当回答一个难题时,人们会使用简化的思维操作系统—

    待学习
    开始阅读
  • 21

    第14章 匹配,找到与你的预测最精准匹配的共识

    第14章 匹配,找到与你的预测最精准匹配的共识 现在请看向天空,你认为两小时内下雨的可能性有多大?你可能很容易就答出了这个问题。你做出判断时毫不费力。你可能在不知不觉中就把对天空黑暗程度的评估转换成了概率判断。 你刚刚做的事就是一种典型的“匹配”(matching)。我们将判断描述为一种思维操作,该思维操作会为主观印象或印象的某个方面在量表上找到对应的值。匹

    待学习
    开始阅读
  • 22

    第15章 选取精确的量表,并多用相对判断

    第15章 选取精确的量表,并多用相对判断 假设你是民事审判案件中的一名陪审员。你目前所掌握的证据大致如下,你要据此做出判断。 琼·格洛弗(Joan Glover)诉General Assistance公司案 一个名叫琼·格洛弗的6岁小女孩吞下了大量非处方抗过敏药AllerFree,需要住院治疗很长时间。大剂量的药物使她的呼吸系统变得很脆弱,因此她很容易患上哮

    待学习
    开始阅读
  • 23

    第16章 模式噪声的构成

    第16章 模式噪声的构成 还记得朱莉吗?我们在第14章中提到的那个早慧的孩子。你曾尝试预测她的大学GPA。以下是有关朱莉的详细介绍。 朱莉是独生女。她的父亲是一位事业有成的律师,母亲是一位建筑师。朱莉大约3岁时,她的父亲患上了一种自体免疫性疾病,不得不居家办公。他花大量的时间陪伴朱莉,并耐心地教她读书识字。朱莉4岁时就能流畅地阅读。她的父亲也曾尝试教她算术,

    待学习
    开始阅读
  • 24

    第17章 噪声源,偏差是引人注目的图形,而噪声是不受我们关注的背景

    第17章 噪声源,偏差是引人注目的图形,而噪声是不受我们关注的背景 哪里有判断,哪里就有噪声,希望你现在也认同这一观点。我们也希望,对你而言这已不再是一件超乎想象的事。这也正是我们着手开展研究的主要动力。经过多年的努力,我们对这个问题的思考已经逐渐深入和完善。现在,来回顾一下我们已经了解的噪声成分、这些成分对噪声的重要影响以及它们在判断中所起的作用。 噪声成

    待学习
    开始阅读
  • 25

    第18章 卓越的判断者,卓越的判断力

    第18章 卓越的判断者,卓越的判断力 至目前为止,我们主要谈论的是人类的判断,而没有对不同的判断者进行区分。显然,在任何一项任务中,有些人做出的判断要优于其他人。即使是由群体做出的判断,如果该群体由高能力个体组成,那么最终的判断也会更优。这就引出了一个重要的问题,即如何甄别出更好的判断者。 有三件事至关重要。如果做判断的人受过良好的训练、更睿智且拥有正确的认

    待学习
    开始阅读
  • 26

    第19章 消除偏差与决策卫生

    第19章 消除偏差与决策卫生 许多研究人员和机构都力图减少判断偏差。在本章中,我们将分析他们的核心发现。我们将介绍消除偏差的各类干预措施之间的区别,并探讨其中一种值得进一步研究的干预措施。随后,我们将讨论如何减少噪声,并介绍决策卫生的概念。 干预:事后及事前消除偏差 减少偏差有两种主要方式,要描述它们的特点,一个好方法是回到测量类比。假设你家浴室里的体重秤在

    待学习
    开始阅读
  • 27

    第20章 司法科学,信息排序是最大的噪声

    第20章 司法科学,信息排序是最大的噪声 2004年3月,在西班牙首都马德里,一组被放置在通勤列车上的炸弹爆炸,造成192人死亡,2000多人受伤。人们在犯罪现场的塑料袋上发现了一枚指纹,并通过国际刑警组织将其传送到了世界各地的执法机构。几天后,美国联邦调查局(FBI)犯罪实验室最终确认这枚指纹属于一个居住在俄勒冈州的美国公民布兰登·梅菲尔德(Brandon

    待学习
    开始阅读
  • 28

    第21章 甄选与汇总,超级预测的两大策略

    第21章 甄选与汇总,超级预测的两大策略 许多判断都涉及预测,比如,下个季度的失业率可能是多少?明年将售出多少辆电动汽车?2050年的气候变化会带来什么影响?盖完一幢新楼需要多长时间?某家公司的年收入是多少?新员工会有什么样的表现?新的空气污染管理制度的成本是多少?谁将赢得选举?这些问题的答案会产生重大影响,因为私人机构和公共机构的一些重要选择往往取决于这些

    待学习
    开始阅读
  • 29

    第22章 医疗决策,用科学的诊断指南减少噪声

    第22章 医疗决策,用科学的诊断指南减少噪声 几年前,我们的一位好朋友保罗被他的主治医师琼斯诊断为患有高血压。琼斯医生建议保罗尝试药物治疗,他给保罗开了利尿剂,但保罗的血压依旧很高,也就是说药物没起到效果。几个星期后,琼斯又开了第二种药物——钙通道阻滞剂,但效果依然不理想。 这些结果使琼斯困惑不已。虽然过去的3个月保罗每星期都会来复诊,但他的血压只是略有下降

    待学习
    开始阅读
  • 30

    第23章 绩效评估,用基于外部视角的共识框架做出量化判断

    第23章 绩效评估,用基于外部视角的共识框架做出量化判断 让我们从一个练习开始:请选出3个你认识的人,他们可以是你的朋友或同事。请在友善、智慧和勤奋这3种特质上给他们进行1~5分的评分,其中1分是最低分,5分是最高分。现在再请另一个很了解他们的人(这个人可以是你的配偶、好友或者最亲密的同事)用同样的方式对这3个人进行评分。 在某些评估中,你和其他评分者很可能

    待学习
    开始阅读
  • 31

    第24章 人员招聘,以结构化指标衡量人才

    第24章 人员招聘,以结构化指标衡量人才 如果你曾经找过工作,那么“招聘面试”这个词可能会唤起你的一些生动而紧张的回忆。工作面试,即求职者与未来的主管或人力专员会面,是进入许多组织的必经之路。 在大多数情况下,面试遵循着既定的流程。在寒暄之后,面试官会要求应聘者描述他们的个人经历,或者详细地描述他们经历过的某些特定情形。再问一些诸如个人成就与挑战、工作动机以

    待学习
    开始阅读
  • 32

    第25章 中介评估法,做出明智决策的核心方法

    第25章 中介评估法,做出明智决策的核心方法 不久前,我们两个人(卡尼曼和西博尼)与我们的朋友丹·罗瓦洛(Dan Lovallo)一起,介绍过组织中使用的一种决策方法。这一方法的首要目的在于减少噪声,我们称之为中介评估法。该方法涵盖了我们前几章所介绍的大多数决策卫生策略,并且它的应用范围很广泛,只要在计划或选项的评估过程中需要考虑和权衡多维度信息,我们就可以

    待学习
    开始阅读
  • 33

    第26章 减少噪声的成本

    第26章 减少噪声的成本 每当我们建议人们消除噪声时,他们可能会以成本过高为由进行反对,并认为在极端情况下,减少噪声根本不可能。我们已经在商业、教育、政府以及其他领域听到过这种反对意见,这种观点虽然有一定的合理性,但言过其实了,或者只不过是一个借口。 为了证明我们的这种反对意见更有说服力,举一个高中老师为文章评分的例子。有位高中老师每星期都要对学生撰写的25

    待学习
    开始阅读
  • 34

    第27章 尊严,人之为人的重要价值观

    第27章 尊严,人之为人的重要价值观 设想如下三个场景:你申请房产抵押,但被拒绝,其原因并非有人实际考察了你的情况,而是因为银行有严格的规定,认为你这种信用等级的人不能申请房产抵押;你的条件很出色,而且一家公司的面试官也觉得你很不错,但你的求职申请被拒绝了,原因是15年前你曾被判刑,而该公司明令禁止录用任何有犯罪前科的人;你被判有罪,但不能被保释,这并非由于

    待学习
    开始阅读
  • 35

    第28章 规则还是标准

    第28章 规则还是标准 如果我们的目标是减少噪声和了解如何减少噪声(或在多大程度上减少噪声),那么我们就有必要区分两种约束行为的方式:规则和标准。很多组织通常会选择其中的一种,或将两者结合起来使用。 在商业领域,某家公司可能会有以下要求:员工必须在指定的时间内工作;每个人的休假时间不能超过两个星期;如果有人将公司的秘密泄露给媒体,那么他就会被解雇。我们也可以

    待学习
    开始阅读
  • 36

    回顾与总结 正视噪声问题

    回顾与总结 正视噪声问题 噪声是我们在做判断时不希望存在的变异,然而噪声实在太多了,本书的核心目标就在于解释为何会如此,以及我们应该如何应对噪声。本书涵盖的内容十分丰富,我们在这里仅从一个宽泛的视角来对书中的核心观点进行简要的回顾和总结。 判断不是计算,也无须遵循精确的规则 需要注意的是,不要把本书中的“判断”一词与“思考”一词混淆。判断是一个相对狭义的概念

    待学习
    开始阅读
  • 37

    结语 一个噪声很少的世界

    结语 一个噪声很少的世界 请想象一下,经过重新设计并减少了噪声的组织会是什么样子。医院、招聘委员会、经济预测机构、政府机构、保险公司、公共卫生机构、刑事司法系统、律师事务所和大学,都会对噪声问题保持警觉,并努力减少这些问题。噪声审查将会成为惯例,或许每年都能进行一次。 未来,组织的领导者将会在更多领域中使用算法来代替人类判断,或将其作为人类判断的补充。人们会

    待学习
    开始阅读
  • 38

    附录1 如何进行噪声审查

    附录1 如何进行噪声审查 附录1是一份关于如何进行噪声审查的实用指南。你可以以企业顾问的视角来阅读这部分内容,设想一下这家企业雇用你来对它的一个部门员工的专业决策进行噪声审查。 顾名思义,噪声审查的重点当然在于考察噪声的普遍性,然而,良好的噪声审查其实也能提供关于员工培训和工作监管中存在的偏差、盲点和缺陷的有价值信息。成功的审查有利于促进部门改革,包括改进专

    待学习
    开始阅读
  • 39

    附录2 决策观察者检查清单

    附录2 决策观察者检查清单 本附录给出了一份决策观察者(见第19章)检查清单的通用示例。这里提供的清单大致遵循做重要决策的时间顺序。 清单中每一项之后的参考问题都对相应的项目做了进一步说明。决策观察者在审视决策过程时应该问自己这些问题。 决策观察者不应照搬照抄这个清单。我们希望它发挥的作用是为决策观察者提供灵感和基准,并使决策观察者能够据此设计出适合自己的偏

    待学习
    开始阅读
  • 40

    附录3 对抗噪声,修正预测

    附录3 对抗噪声,修正预测 匹配性预测是我们依赖直觉式匹配过程而产生的错误(参见第14章)。当我们基于现有信息做预测时,我们会进行匹配性预测,就好像我们能够依据这些信息对结果做出完美的或准确率非常高的预测一样。 让我们来回顾一下朱莉的例子,她4岁就能流利地阅读,那么她在大学时的GPA会是多少呢?如果你预测朱莉在大学时的GPA是3.8,这就意味着你从直觉上判断

    待学习
    开始阅读
  • 41

    致谢

    我们要感谢很多人。林内亚·甘地(Linnea Gandhi)是我们的参谋长,她为我们提供了大量的指导和帮助,使我们的工作可以有条不紊地推进,让我们的工作充满欢声笑语。基本可以说,是她主持了本书的撰写。除此之外,她还为本书的初稿提出了许多宝贵建议,没有她,我们无法顺利完成本书。丹·罗瓦洛对成书也起到了非常重要的作用,本书的观点最初就源于他与人合著的一篇文章。我

    待学习
    开始阅读
  • 42

    译者后记

    汪祚军 中国科学院心理研究所博士,宁波大学教授 感谢编辑部独具慧眼,能够邀请中国科学院心理研究所李纾研究员领衔本书的翻译工作。李纾老师是国内最早从事行为决策研究的专家,在行为决策领域深耕数十年,其提出的“齐当别”决策模型在心理学界具有重要的影响力。作为行为决策领域的一名研究者、李纾老师曾经的博士生,能够参与本书的翻译工作,我深感荣幸。 在拿到本书的英文原书后

    待学习
    开始阅读
  • 43

    注释

    引言 偏差与噪声,人类判断的两类错误 射击场只是一种隐喻:1778年,瑞士数学家丹尼尔·伯努利(Daniel Bernoulli)在一篇关于评估问题的论文中使用弓和箭进行了相同的类比。Bernoulli, “The Most Probable Choice Between Several Discrepant Observations and the For

    待学习
    开始阅读

Local EPUB Text

第4章 什么是判断

第4章 什么是判断

本书论述的是一般意义上的专业判断,我们假设如果做判断的人有足够的能力,就能做出准确的判断。然而,判断这一概念本身包含着一个你不得不承认的事实:你永远无法确定一个判断是不是准确。

请思考“判断问题”和“主观判断”这两个短语的差别。我们认为“太阳明天会升起”或“NaCl是氯化钠的化学式”这样的陈述并非判断,因为任何理性的人都会完全同意上述观点。判断问题在于其结果存在不确定性,我们承认理性或有能力的人在某一问题上是可能存在分歧的。

然而,分歧需要有一定的限度。事实上,“判断”这个词主要用于人们能够达成一致意见的场合。判断问题不同于品位或意见,在后两种情况下,彼此之间的差异是完全能被接受的。对于那些对噪声审查感到震惊的保险公司高管来说,理赔员在“披头士乐队和滚石乐队哪个更好”,或是“鲑鱼和金枪鱼哪个更好”之类问题上存在的分歧,并不会让人觉得不妥。

包括专业判断在内的判断介于两者之间:一端是事实或计算问题,另一端是品位或意见问题。因此,不同主体的判断必然存在一定程度的分歧。

到底多大的分歧是可以被接受的?这本身就是一个判断问题,而且取决于问题的难度。人们很容易对一个荒诞不经的判断达成一致。比如,在一起普通诈骗案中,法官们会一致认同:判罚款1美元或判无期徒刑都是不合理的;在葡萄酒比赛中,评委们对哪种葡萄酒应该获奖可能会分歧很大,但对于哪些葡萄酒应该被排除在获奖的门槛之外却往往能达成一致。

判断的经验

在进一步讨论判断经验之前,我们邀请你自己先做一个判断,完成这项练习有利于你理解本章的内容。

设想你是一个团队里的成员,负责评估一家中等规模的地区性金融公司的CEO候选人,该公司正面临着日益激烈的竞争。你需要评估以下候选人在工作两年后获得“成功”的可能性。成功的定义很简单,就是候选人在两年任期结束时,仍能保住CEO的职位。用0(不可能)到100(必然)范围内的数字来表示概率。

迈克尔·甘巴迪(Michael Gambardi)今年37岁。12年前从哈佛商学院毕业以来,已经任职过几家公司。早期,他是两家初创公司的创始人和投资人,但由于没有得到足够的资金支持而宣告失败。随后,他加入一家大型保险公司,并迅速晋升为欧洲地区的首席运营官。在该职位上,他发起并实施了一项有助于及时解决索赔问题的重要改进措施。同事和下属都认为他有效率,但也霸道、粗暴,在他的任期内,高管的离职率很高。同事和下属也认可他的正直以及愿意为失败承担责任。在最近的两年里,他一直担任一家中型金融公司的CEO,这家公司最初面临倒闭的风险,但他成功使公司转危为安。人们认为他是成功的,尽管与他个人合作很难。目前,他表示有兴趣换个工作。几年前面试过他的人力资源专家在创造力和精力两个方面给了他高分,但也表示他很傲慢,有时甚至是专横的。

让我们简单回顾一下已知信息,甘巴迪是一家地区性金融公司CEO的候选人,该公司已经取得了一定的成就,但也面临着日益激烈的竞争。你需要回答:如果甘巴迪被录用,两年后仍在职的可能性有多大?请在继续阅读后面的内容之前,给出一个0~100的具体数字。如有必要,你也可以重新阅读上文的描述。

如果你认真思考这个题目,可能会发现自己很难做出判断。这里有大量的信息,但很多信息看起来并不一致,你必须努力构建一个帮助自己做决策的前后一致的印象。在建构这种印象时,你会专注于一些看起来非常重要的细节,但同时也可能忽略了其他细节。如果要求你解释下自己给出的数字,你可能会提到一些主要的事实,但这些又不足以全面地解释你的判断。

上述思维过程揭示了我们在“判断”过程中的几个心理特征。

· 首先,在前文所提供的线索(这些可能只是你需要了解的一部分信息)中,你对一些信息的关注度可能会高于对其他信息的关注度,并且你可能完全没有意识到这一点。你有没有意识到“甘巴迪”是一个意大利姓氏?你记得他是从哪所学校毕业的吗?这些设置是为了让你信息过载,从而让你无法回忆起该案例的所有细节。而且,你回忆起来的内容很有可能和其他读者能够回忆起来的内容不同。“选择性注意”(selective attention)和“选择性回忆”(selective recall)是人与人之间判断差异性的源头之一。

· 其次,你随意整合了所有线索,形成了一个关于甘巴迪的整体印象。这里的关键词是“随意”,也就是“非正式”,你并没有制订一个详细的计划来回答这一问题。在没有完全意识到的情况下,你的大脑建构了一个有关甘巴迪的优点、弱点以及他有可能面临的挑战的整体印象。这一“非正式”的思考能够让你快速做出判断,但它也有可能产生差异性:一个正式的过程,例如增加一列数字,能够确保获得相对一致的结果,但在非正式的心理运作过程中,噪声难以避免。

· 最后,你将整体印象转换成一个用于衡量成功概率的数字。将整体印象与0~100中的某个具体数字对应起来是一个了不起的过程,我们在第14章会对此再次进行讨论。同样,你并不能确切地知道这么做的原因。比如,为什么你选择65,而不是61或69?很有可能的是,它只是在某个时间点,你脑海中忽然就跳出来的一个数字。你确认一下这个数字是否合适。如果你觉得不合适,大脑中则会跳出另一个数字。这一过程也会导致人与人之间的差异性。

既然复杂判断过程中的这三个步骤都会产生差异性,那么在回答有关甘巴迪的问题时存在噪声也就不奇怪了。如果你找几个朋友来阅读上面的案例,你会发现,你们对他成功的概率的评估也会有很大差异。我们让115名MBA学生来对之做判断,他们对甘巴迪能成功的概率的评估在10~95之间,这意味着非常大的噪声。

你可能会发现,秒表实验和甘巴迪问题体现的是两类噪声:秒表实验中产生的差异性是单一判断者的噪声;而甘巴迪案例中,判断的差异性是不同判断者之间的噪声。从测量学的角度而言,第一个问题反映的是“个体内的信度”(within-person reliability),第二个问题反映的是“个体间的信度”(between-person reliability)。

判断的目的:只是响应“做出判断”的内部信号

你对甘巴迪问题的回答是一种预测性判断——关于这一概念,我们在前文中已经定义过,然而,它在一些很重要的方面不同于其他预测性判断,如曼谷明天的最高气温、今晚足球赛的结果或下届总统大选的结果。如果在这些问题上你不同意朋友的判断,你会在某个时间点知道谁是对的。但是,如果在甘巴迪日后表现的问题上你和朋友之间存在分歧,时间也无法告诉你谁是对的,原因很简单:甘巴迪根本不存在。

即使要评估的是一个真实的人,并且我们知道结果,我们也无法证实或证伪一个单一的概率判断(除非概率是0或1)。结果并不能表明“事前概率”(ex ante probability)是多少。如果一个被认为有90%的可能性会发生的事件并未真正发生,也并不能说明概率判断是不好的,毕竟,即使某个结果只有10%的可能性会发生,它也有可能真正发生。基于如下两个不同的原因,甘巴迪案例就是一个无法验证的预测性判断:甘巴迪是一个虚构的人物;关于该人物的判断结果是概率性的。

很多专业判断都是无法验证的。除非出现严重的错误,核保员可能永远无法知道某一特定保单的报价是过高还是过低。其他一些预测因为是有条件的,所以也无法验证。“如果我们开战,我们将被击溃”是一个重要预测,但它很可能不能验证。还有一种情况是:预测的时间跨度太大,以至于预测者无法验证结果,例如关于21世纪末全球平均气温的预测。

上述甘巴迪问题无法被验证的特征会影响你的判断吗?例如,你是否质疑甘巴迪是真实人物?你是否会在意下文能否告知你答案?你是否想过,即使告知你答案,你也无法解决当前所面临的问题?你可能没有想过这些问题,因为当你回答问题的时候,上述这些因素似乎无关紧要。

能否验证并不会改变你的判断经验。在一定程度上,当一个问题的答案很快就被揭晓时,你可能会更加积极地思考,因为害怕出错,所以你的注意力更加集中。相反,你可能会拒绝对一个荒谬的假设性问题做太多思考,比如,如果甘巴迪有三条腿、能飞,他会是一个更好的CEO吗?总体而言,你会用解决现实问题的方式去解决一个假设性问题。这种相似性对心理学研究很重要,因为很多研究使用的都是这种假设性问题。

既然没有结果,你也不会去问是否有结果,那么按理说,你不会尽可能去减少判断与结果之间的错误,但你仍试图去做出正确的判断,给出一个你有足够信心的数字。当然,你对自己的答案并没有十足的把握。你能意识到一些不确定性,并且正如我们所看到的那样,有可能存在一些超出你原本认知范畴的不确定性。但在某个时间点上,你决定不再进一步思考,而是给出最终答案。

是什么让你觉得自己做出了正确的判断?我们将这种感觉称为“做出判断的内部信号”(internal signal of judgment completion),这种内部信号与任何外部信息都无关。

如果你的答案与外部证据相契合,那么你就会觉得自己是对的。0或100这两个数字无法给你契合感:这两个数字所隐含的信心与现有的混乱、模棱两可、相互矛盾的证据是不匹配的。但是,不管你给出的是哪个数字,它都能够带给你所需要的一致感。正如你之前的经历告诉你的那样,判断的目标就是达到一致性的解决方案。

内部信号的本质特征在于:一致感是判断经验的一部分。它并不完全取决于真正的结果。因此,内部信号对于不可验证的判断与对于真实的、可验证的判断一样可用。这样就可以解释,为什么我们对于像甘巴迪这样的虚假人物做出判断的经验,就像是在真实世界中做判断。

评估判断的两种方法:结果和过程

能否被验证并不会改变判断的过程,但会改变事后对判断的评估。

结果可验证的判断可以由一个客观的观察者,根据一个简单的误差测量方式,即通过判断与结果之间的差异进行评定。如果天气预报员说今天的最高气温会达到21摄氏度,而事实是18摄氏度,那么我们可以说预报员犯了一个正3度的错误。显然,这种方法不适用于类似甘巴迪问题中的非验证性判断,因为这种判断没有真正的结果。那么,我们如何去界定一个判断的好坏呢?

答案是还有另一种评估判断的方法,这种方法既适用于可验证的判断,也适用于不可验证的判断,而且其核心在于评估判断的过程。当我们在说好或不好的判断时,我们要么指的是判断的输出,比如甘巴迪的案例中你给出的数值;要么指的是判断的过程,也就是你是如何得出这个数值的。

评估判断过程的一种方法是,观察这一过程在应用于大量案例时的表现。以一个政治分析师为例,他在地方选举中预测了大量候选人的获胜可能性。他宣称,这些候选人中的100人有70%的可能性获胜。如果这100人中最终有70人当选,我们就会认为该政治分析师的预测很准确。虽然单个概率判断无法用正确或错误来评价,但其整体是可以被验证的。同样,通过审查大量案例的统计结果,我们可以更好地确定是否存在针对某一特定群体的偏见。

关于判断过程的另一个问题是,它是否符合逻辑或概率理论。大量关于判断中认知偏差的研究都在分析这个问题。

关注判断过程而不是结果,我们就可以对无法验证的判断进行评估,例如对虚构问题的判断或时间跨度很长问题的预测。虽然无法将其与已知的结果进行比较,但我们仍然可以评估这些判断是否正确。当我们将重心放在提升判断品质,而不仅仅是评估判断的好坏时,我们也会将注意力放在判断过程上。我们在本书中推荐的所有减少偏差和噪声的方法,都是为了实现这样的判断过程:能够在同类案例中从整体上最大限度地减少误差。

我们比较了两种评估判断品质的方法:一种是比较判断的结果,另一种是比较判断过程的品质。需要注意的是,对于可验证的判断,如果在单个案例中使用这两种评估方法,可能会得出不同的结论。一名熟练、谨慎的预测者在使用最好的工具和技巧对季度通胀进行预测时,也经常会出错。而在关于单个季度的预测中,即使是让黑猩猩掷骰子,也有可能给出准确的“答案”。

研究决策的学者为解决这一问题提出了清晰的建议:关注过程,而不是单个案例的结果。然而,这并非现实生活中的惯常做法。专家们也经常评估自己的判断与可验证结果之间的一致程度,如果你问他们,他们判断的目标是什么,他们会说:尽可能地与结果一致。

总而言之,在可验证的判断中,人们通常声称,他们判断的目标是尽可能使自己的预判与结果一致。而事实上,无论是可验证的判断还是不可验证的判断,他们实际想要获得的是做出判断的内部信号,这种信号源自事实与判断之间的一致性。其实,他们应该追求的目标是:努力实现能够对一系列类似案件做出最佳判断的过程。

评估性判断vs预测性判断

到目前为止,本章主要集中讨论的是预测性判断的工作,随后讨论的也主要是这类工作。然而,在第1章中讨论的弗兰克尔法官以及美国联邦法官量刑中的噪声,考察的则是另一种类型的判断。给罪犯判重罪不是预测,而是“评估性判断”(evaluative judgment),目的在于使犯罪严重程度与刑期之间相匹配。葡萄酒比赛的评委和餐厅评论家做出的是评估性判断。对论文进行评分的教授、滑冰比赛的评委以及对科研项目进行评估以决定是否给予资助的委员会做出的判断也都是评估性判断。

在多选项决策中对不同选项进行权衡也是一种评估性判断。类似的例子包括:经理们在一系列候选人中进行选择,管理团队在不同策略之间进行选择,以及总统们选择如何应对非洲的埃博拉疫情。可以确定的是,所有这些决策有赖于预测性判断来提供信息。例如,某位候选人第一年的表现如何;股票市场对某项战略举措的反响如何;如果放任不管,传染病会以多快的速度传播。然而,最终的决策过程需要在每个选项的优势和劣势之间进行权衡,而这种权衡是通过评估性判断实现的。

就像预测性判断,评估性判断也会出现一定范围内的不一致性。没有一位称职的美国联邦法官会说:“这是我最喜欢的判决,我根本不在乎我的同事是否有其他看法。”从一系列策略中做出选择的决策者会有这样的预期:如果同事或其他人获得了相同的信息且具有相同目标,他们就会赞同自己的选择,至少不会偏离太远。评估性判断在一定程度上依赖于判断者的价值观和偏好,而不仅仅是个人品位或意见的问题。

可见,预测性判断和评估性判断的边界比较模糊,做出判断的人往往没有意识到二者间的差异。做出判决的法官和给论文评分的教授会努力思考,并力图找到“正确”答案。他们对自己的判断和做出判断的理由很有信心,在做出预测性判断(如:这款新产品销量如何)和评估性判断(如:我的助手今年表现如何)时,专家们感受相同、行为相同,当然也会以相同的方式阐述自己做出判断的理由。

“任意残酷行为”,噪声的最大问题

在预测性判断中存在噪声,则意味着哪里出错了。举个例子,如果两名医生在诊断上有分歧,或两名预测员对下一季度的销售额持不同意见,那么他们之中至少有一个人是错的。原因可能是其中一个人缺乏技能,也可能是存在其他噪声。不管是什么原因,错误的判断可能会给依赖诊断与预测行事的人带来严重的后果。

在评估性判断中存在噪声也会有问题,但原因不同。在司法系统中,如果法官是可以互换或随机分配的,关于同一案件的巨大分歧会违背人们对司法公正性和一致性的期望。如果对同一被告的判决差异很大,那么我们就是在做弗兰克尔法官所谴责的那种残酷专横之事。甚至那些信奉刑罚个别化的法官以及对抢劫犯的判决存有异议的法官也会认可:如果不同判决之间的差异太大,大到就像抽签一样,那就是有问题的。这一问题在其他场景中也存在,只是戏剧性没那么强:不同的教授对同一篇论文给出的评分差异巨大;不同的机构对同一家餐馆给出了不同的食品安全评分;不同的评委对同一位滑冰选手打出不同的分数。再比如,某人因患有抑郁症而获得了残障人士享有的社会保障,而另一个状况相同的人则什么都没有得到。

即使不公平不是一个特别需要关注的问题,系统噪声也会带来另一个问题。受评估性判断影响的人期待这些判断反映的是系统的价值观,而不是个别法官的价值观。设想一下:一个客户抱怨笔记本电脑有缺陷,并得到了全额退款,而另一个客户仅仅收到道歉;一位在公司工作了5年的员工要求升职并获批准,而另一位绩效相同的员工则被婉拒……这些都是很严重的问题。这样看来,系统噪声就是不一致,而不一致会损害系统的可信度。

噪声是可以测量的

只需对同一问题进行多次判断,我们就可以测量噪声,而且我们并不需要知道这一问题的真实值。正如引言中提到的射击的故事,当我们隐去靶子时,我们是看不见靶心的,但是可以看到子弹落点的分布情况。只要我们知道所有的射击手都是瞄准靶心的,那我们就可以测量噪声,也就是进行噪声审查。如果我们要求所有的预测者预测下个季度的销售额,预测的分散程度就是噪声。

偏差和噪声之间的这一区别对于改善判断品质非常关键。在我们无法验证判断是否正确的前提下,宣称可以改进判断听起来是自相矛盾的,但我们的确可以,因为只需从测量噪声开始。

无论判断的目标是获得精确的结果,还是在不同价值之间进行复杂的权衡,我们都不希望噪声存在。不过,我们通常可以对它进行测量。正如我们将会在第五部分中讨论的那样,只要可以测量噪声,我们就可以减少它。