学习进度

0%

阅读时长

未满 1 分钟

最近阅读:未开始阅读

核心概念

待提炼

章节学习

  • 1

    献词

    献给诺加、奥里和吉利 ——丹尼尔·卡尼曼 献给范丁和莱莉亚 ——奥利维耶·西博尼 献给萨曼莎 ——卡斯·R.桑斯坦

    待学习
    开始阅读
  • 2

    重磅赞誉

    从“偏差”到“噪声”,作为心理学家的卡尼曼,挑战的是经济学的“理性人”假设,并因开启了行为经济学的大门而获得诺贝尔经济学奖。他一直关注的是人类在决策中是如何犯错的,在这本书中,他深入分析了噪声的影响,但也乐观地预期,可以通过发掘埋没在大数据中的信息来减少决策中的噪声,这可以说是大数据渗透到行为经济学领域的新趋势。 巴曙松 北京大学汇丰金融研究院执行院长,中国

    待学习
    开始阅读
  • 3

    测一测 如何做一个聪明的决策者?

    测一测 如何做一个聪明的决策者? 想知道你的判断 是怎么掉入噪声陷阱的吗? 扫码测一测, 立即获取答案及解析, 看看你的“降噪等级”。 1.卡尼曼是世界上第一个凭借心理学研究获得诺贝尔经济学奖的人。这个说法对吗? A.对 B.不对 2.卡尼曼指出:人类判断出错的原因有两种。一种是偏差,另一种是什么呢? A.误差 B.噪声 C.系统认知 3.在做一个判断时,以

    待学习
    开始阅读
  • 4

    推荐序1 在无法回避噪声的世界,更好地追求高级境界与极致效益

    推荐序1 Preface 在无法回避噪声的世界, 更好地追求高级境界与极致效益 彭凯平 清华大学社会科学学院院长 每年七八月份,我都会参加清华大学的本科生招生工作,由此而目睹了一个问题:高考揭榜之后,高中毕业生及其家长应如何做好志愿填报?学校和专业的选择非常重要,很有可能会决定一个学生一辈子的命运,其中牵涉的问题就与我们心理学中一个重要的研究领域紧密相关,那

    待学习
    开始阅读
  • 5

    推荐序2 穿越噪声的决策

    推荐序2 Preface 穿越噪声的决策 朱宁 上海交通大学上海高级金融学院金融学教授,副院长 我抱着浓厚的兴趣读完了诺贝尔经济学奖得主丹尼尔·卡尼曼教授等的新作《噪声》一书,这本书汇集了卡尼曼教授近十年的最新发现。对于我所从事的行为金融学研究领域而言,《噪声》算得上是一本“专业书”,但是读完之后,我认为它很可能是卡尼曼教授继《思考,快与慢》后,又一次成功将

    待学习
    开始阅读
  • 6

    中文版序 哪里有判断,哪里就有噪声

    中文版序 Preface 哪里有判断,哪里就有噪声 我们非常荣幸,也非常感激,能够在中国出版这本书。《噪声》重点关注人类的判断,关注它是如何出错的,以及如何让它变得更好。无论是医学、法律、公共政策、商业,还是日常生活领域中,我们做出判断的过程中存在的问题,是偏好根据经验做判断的人类的共性问题。 数十年来,偏差问题备受瞩目。在《思考,快与慢》一书中,本书的作者

    待学习
    开始阅读
  • 7

    引言 偏差与噪声,人类判断的两类错误

    引言 Introduction 偏差与噪声,人类判断的两类错误 试想一下,你的朋友组成了A、B、C、D共4支队伍,来到一个射击场。每队中有5个人,他们共用一支来复枪,且每人只开了一枪。图0-1显示了他们的射击结果。 图0-1 4支队伍的射击结果 理想情况是,每一枪都能正中靶心。 A队几乎达到了理想情况,他们的每一发子弹都紧紧围绕着靶心,接近完美模式。 B队的

    待学习
    开始阅读
  • 8

    第1章 犯罪和充满噪声的判罚

    第1章 犯罪和充满噪声的判罚 假设某人被指控犯了罪,例如到商店行窃、私藏海洛因、袭击他人或持枪抢劫,该案件可能的判决结果是什么? 答案不应取决于该案件恰巧被指派给哪位法官、天气是冷是热,以及当地球队在前一天是输是赢。如果3个背景类似的人被指控犯有同一罪行,最后却得到截然不同的处罚,例如第一个人被判缓刑,第二个人被判2年有期徒刑,最后一个人被判10年有期徒刑,

    待学习
    开始阅读
  • 9

    第2章 系统噪声,给人达成一致的错觉

    第2章 系统噪声,给人达成一致的错觉 我们最初接触噪声,并对这个主题产生兴趣,并不是因为遇到了像刑事司法案件那般富有戏剧性的案例。实际上,这次邂逅纯属偶然,缘于一家保险公司,这家公司与我们中的两人所属的咨询公司有合作。我们的研究揭示了营利性组织中存在噪声问题的严重性——组织会因为决策中的噪声损失惨重。我们在保险公司的经历有助于解释为什么噪声问题常常被忽视,以

    待学习
    开始阅读
  • 10

    第3章 单一决策,仅发生一次的重复决策

    第3章 单一决策,仅发生一次的重复决策 到目前为止,我们所讨论的案例研究都与重复决策相关。比如,对盗窃犯的恰当判决是什么?对某一特定风险该收取多少保费?虽然每个具体的案例在某种意义上都是独特的,但像这样的判断属于重复决策。医生诊断患者,法官审理假释案件,招生人员审查入学申请书,会计师准备税单等,这些都是重复决策。 正如前一章所介绍的,重复决策中的噪声可以通过

    待学习
    开始阅读
  • 11

    第4章 什么是判断

    第4章 什么是判断 本书论述的是一般意义上的专业判断,我们假设如果做判断的人有足够的能力,就能做出准确的判断。然而,判断这一概念本身包含着一个你不得不承认的事实:你永远无法确定一个判断是不是准确。 请思考“判断问题”和“主观判断”这两个短语的差别。我们认为“太阳明天会升起”或“NaCl是氯化钠的化学式”这样的陈述并非判断,因为任何理性的人都会完全同意上述观点

    待学习
    开始阅读
  • 12

    第5章 测量误差,噪声与偏差的代价一样大

    第5章 测量误差,噪声与偏差的代价一样大 显而易见的是,一致性的偏差会引发代价高昂的错误。如果体重秤在你每次称体重时都自动加上一定的重量,如果一位乐观的经理总是预测项目只需花费实际所需时间的一半,如果一位谨小慎微的经理总是年复一年地低估未来的销售额,那么后果都将会非常严重。 我们已经知道,噪声会引发代价高昂的错误。如果一位经理大多数时候预测的项目所需时间只是

    待学习
    开始阅读
  • 13

    第6章 噪声分析:所有判断都存在3类噪声

    第6章 噪声分析:所有判断都存在3类噪声 在上一章,我们讨论了单个案例中测量或判断的变异性。在单个案例中,判断的所有变异性都是误差,而误差由偏差和噪声组成。我们考察的判断系统,包括法院和保险公司的判断系统,它们的目的在于处理不同案例,并对这些案例进行区分。如果美国的联邦法官和保险理赔员对他们手头的所有案例都做出相同的判断,那他们就没有什么存在的价值了。对不同

    待学习
    开始阅读
  • 14

    第7章 情境噪声,无时无刻不在影响着我们的判断

    第7章 情境噪声,无时无刻不在影响着我们的判断 想象一名职业篮球运动员正在准备罚球的场景:他站在罚球线上,全神贯注地准备投篮。这是他练习过无数次的一系列动作,他能投中吗?我们无法预知结果。 在NBA的比赛中,球员们通常能够4罚3中。显然,一些球员比其他球员表现得更好,但没有人能做到百发百中(3)。虽然篮筐一直都是距离地面3.05米,与罚球线的垂直距离一直是4

    待学习
    开始阅读
  • 15

    第8章 群体是如何放大噪声的

    第8章 群体是如何放大噪声的 个体判断中存在噪声的结果已经很糟糕了,但群体决策中的噪声危害更甚。群体决策可能会由于一些无关因素而朝任何一个方向改变。谁先发言、谁后发言,谁说话更自信,谁穿着黑色衣服,谁和谁挨着坐,谁在某个时刻笑了/皱眉了/呈现出其他身体姿势……所有这些因素都会影响结果。相似的群体每一天都会做出各种不同的决策,如雇用、晋升、破产、沟通策略、环境

    待学习
    开始阅读
  • 16

    第9章 判断与模型,简单的模型普遍优于人类判断

    第9章 判断与模型,简单的模型普遍优于人类判断 很多人都对预测未来的工作绩效感兴趣,不只是自己的,还有别人的。因此,绩效预测是用来考察预测性判断的实用例子。例如,一家大公司在招聘高管时,聘请了一家专业咨询公司对两名候选人莫妮卡和娜塔莉进行评估,并以取值为1~10分的量表对两人的领导力、沟通能力、人际交往能力、职业技能、应聘动机等维度进行打分(见表9-1)。你

    待学习
    开始阅读
  • 17

    第10章 无噪声的规则

    第10章 无噪声的规则 近年来,人工智能(Artificial Intelligence)特别是机器学习技术让机器能够执行许多以前只有人类才能执行的任务。机器学习算法可以承担人脸识别、语言翻译、分析医学影像等任务,并且可以以惊人的速度和准确性来处理计算问题,例如为成千上万名驾驶员迅速规划行车路线。它们还可以执行困难的预测任务:预测美国最高法院的判决;识别哪些

    待学习
    开始阅读
  • 18

    第11章 哪里有预测,哪里就有客观无知

    第11章 哪里有预测,哪里就有客观无知 我们经常同一些公司高管分享第9章和第10章中的研究内容,并通过发人深省的发现让他们意识到人类的判断是有限的。这些发现已经存在了半个多世纪,应该很少有人能避开它们,但人们仍然对这些发现很抵触。 在我们的听众里,有一些高管会很自豪地告诉我们,相比于定量分析,他们更相信自己的直觉;其他人虽然没明说,但他们也有同样的看法。有关

    待学习
    开始阅读
  • 19

    第12章 常态谷:事情虽无法预测,但可以被理解

    第12章 常态谷:事情虽无法预测,但可以被理解 现在我们来考虑一个更大的问题:在这个世界上,有些问题容易解决,有些问题却充满了客观无知,那我们应如何自处呢?毕竟,在存在很严重的客观无知的情况下,我们很快就能意识到,用水晶球来预测未来是徒劳的,但我们通常并不会对这个世界产生这种体验。相反,正如上一章所提到的,我们一直在基于少量的有用信息来对未来做出大胆预测。在

    待学习
    开始阅读
  • 20

    第13章 启发式、偏差与噪声

    第13章 启发式、偏差与噪声 本书是对横跨半个世纪的关于人类直觉判断研究的延续,也就是所谓的“启发式和偏差研究项目”(heuristics and biases program)。《思考,快与慢》一书对该研究项目前40年的研究内容进行了回顾,探讨了能够解释“直觉思维的奇妙与缺陷”的心理机制。该项目的核心思想是,当回答一个难题时,人们会使用简化的思维操作系统—

    待学习
    开始阅读
  • 21

    第14章 匹配,找到与你的预测最精准匹配的共识

    第14章 匹配,找到与你的预测最精准匹配的共识 现在请看向天空,你认为两小时内下雨的可能性有多大?你可能很容易就答出了这个问题。你做出判断时毫不费力。你可能在不知不觉中就把对天空黑暗程度的评估转换成了概率判断。 你刚刚做的事就是一种典型的“匹配”(matching)。我们将判断描述为一种思维操作,该思维操作会为主观印象或印象的某个方面在量表上找到对应的值。匹

    待学习
    开始阅读
  • 22

    第15章 选取精确的量表,并多用相对判断

    第15章 选取精确的量表,并多用相对判断 假设你是民事审判案件中的一名陪审员。你目前所掌握的证据大致如下,你要据此做出判断。 琼·格洛弗(Joan Glover)诉General Assistance公司案 一个名叫琼·格洛弗的6岁小女孩吞下了大量非处方抗过敏药AllerFree,需要住院治疗很长时间。大剂量的药物使她的呼吸系统变得很脆弱,因此她很容易患上哮

    待学习
    开始阅读
  • 23

    第16章 模式噪声的构成

    第16章 模式噪声的构成 还记得朱莉吗?我们在第14章中提到的那个早慧的孩子。你曾尝试预测她的大学GPA。以下是有关朱莉的详细介绍。 朱莉是独生女。她的父亲是一位事业有成的律师,母亲是一位建筑师。朱莉大约3岁时,她的父亲患上了一种自体免疫性疾病,不得不居家办公。他花大量的时间陪伴朱莉,并耐心地教她读书识字。朱莉4岁时就能流畅地阅读。她的父亲也曾尝试教她算术,

    待学习
    开始阅读
  • 24

    第17章 噪声源,偏差是引人注目的图形,而噪声是不受我们关注的背景

    第17章 噪声源,偏差是引人注目的图形,而噪声是不受我们关注的背景 哪里有判断,哪里就有噪声,希望你现在也认同这一观点。我们也希望,对你而言这已不再是一件超乎想象的事。这也正是我们着手开展研究的主要动力。经过多年的努力,我们对这个问题的思考已经逐渐深入和完善。现在,来回顾一下我们已经了解的噪声成分、这些成分对噪声的重要影响以及它们在判断中所起的作用。 噪声成

    待学习
    开始阅读
  • 25

    第18章 卓越的判断者,卓越的判断力

    第18章 卓越的判断者,卓越的判断力 至目前为止,我们主要谈论的是人类的判断,而没有对不同的判断者进行区分。显然,在任何一项任务中,有些人做出的判断要优于其他人。即使是由群体做出的判断,如果该群体由高能力个体组成,那么最终的判断也会更优。这就引出了一个重要的问题,即如何甄别出更好的判断者。 有三件事至关重要。如果做判断的人受过良好的训练、更睿智且拥有正确的认

    待学习
    开始阅读
  • 26

    第19章 消除偏差与决策卫生

    第19章 消除偏差与决策卫生 许多研究人员和机构都力图减少判断偏差。在本章中,我们将分析他们的核心发现。我们将介绍消除偏差的各类干预措施之间的区别,并探讨其中一种值得进一步研究的干预措施。随后,我们将讨论如何减少噪声,并介绍决策卫生的概念。 干预:事后及事前消除偏差 减少偏差有两种主要方式,要描述它们的特点,一个好方法是回到测量类比。假设你家浴室里的体重秤在

    待学习
    开始阅读
  • 27

    第20章 司法科学,信息排序是最大的噪声

    第20章 司法科学,信息排序是最大的噪声 2004年3月,在西班牙首都马德里,一组被放置在通勤列车上的炸弹爆炸,造成192人死亡,2000多人受伤。人们在犯罪现场的塑料袋上发现了一枚指纹,并通过国际刑警组织将其传送到了世界各地的执法机构。几天后,美国联邦调查局(FBI)犯罪实验室最终确认这枚指纹属于一个居住在俄勒冈州的美国公民布兰登·梅菲尔德(Brandon

    待学习
    开始阅读
  • 28

    第21章 甄选与汇总,超级预测的两大策略

    第21章 甄选与汇总,超级预测的两大策略 许多判断都涉及预测,比如,下个季度的失业率可能是多少?明年将售出多少辆电动汽车?2050年的气候变化会带来什么影响?盖完一幢新楼需要多长时间?某家公司的年收入是多少?新员工会有什么样的表现?新的空气污染管理制度的成本是多少?谁将赢得选举?这些问题的答案会产生重大影响,因为私人机构和公共机构的一些重要选择往往取决于这些

    待学习
    开始阅读
  • 29

    第22章 医疗决策,用科学的诊断指南减少噪声

    第22章 医疗决策,用科学的诊断指南减少噪声 几年前,我们的一位好朋友保罗被他的主治医师琼斯诊断为患有高血压。琼斯医生建议保罗尝试药物治疗,他给保罗开了利尿剂,但保罗的血压依旧很高,也就是说药物没起到效果。几个星期后,琼斯又开了第二种药物——钙通道阻滞剂,但效果依然不理想。 这些结果使琼斯困惑不已。虽然过去的3个月保罗每星期都会来复诊,但他的血压只是略有下降

    待学习
    开始阅读
  • 30

    第23章 绩效评估,用基于外部视角的共识框架做出量化判断

    第23章 绩效评估,用基于外部视角的共识框架做出量化判断 让我们从一个练习开始:请选出3个你认识的人,他们可以是你的朋友或同事。请在友善、智慧和勤奋这3种特质上给他们进行1~5分的评分,其中1分是最低分,5分是最高分。现在再请另一个很了解他们的人(这个人可以是你的配偶、好友或者最亲密的同事)用同样的方式对这3个人进行评分。 在某些评估中,你和其他评分者很可能

    待学习
    开始阅读
  • 31

    第24章 人员招聘,以结构化指标衡量人才

    第24章 人员招聘,以结构化指标衡量人才 如果你曾经找过工作,那么“招聘面试”这个词可能会唤起你的一些生动而紧张的回忆。工作面试,即求职者与未来的主管或人力专员会面,是进入许多组织的必经之路。 在大多数情况下,面试遵循着既定的流程。在寒暄之后,面试官会要求应聘者描述他们的个人经历,或者详细地描述他们经历过的某些特定情形。再问一些诸如个人成就与挑战、工作动机以

    待学习
    开始阅读
  • 32

    第25章 中介评估法,做出明智决策的核心方法

    第25章 中介评估法,做出明智决策的核心方法 不久前,我们两个人(卡尼曼和西博尼)与我们的朋友丹·罗瓦洛(Dan Lovallo)一起,介绍过组织中使用的一种决策方法。这一方法的首要目的在于减少噪声,我们称之为中介评估法。该方法涵盖了我们前几章所介绍的大多数决策卫生策略,并且它的应用范围很广泛,只要在计划或选项的评估过程中需要考虑和权衡多维度信息,我们就可以

    待学习
    开始阅读
  • 33

    第26章 减少噪声的成本

    第26章 减少噪声的成本 每当我们建议人们消除噪声时,他们可能会以成本过高为由进行反对,并认为在极端情况下,减少噪声根本不可能。我们已经在商业、教育、政府以及其他领域听到过这种反对意见,这种观点虽然有一定的合理性,但言过其实了,或者只不过是一个借口。 为了证明我们的这种反对意见更有说服力,举一个高中老师为文章评分的例子。有位高中老师每星期都要对学生撰写的25

    待学习
    开始阅读
  • 34

    第27章 尊严,人之为人的重要价值观

    第27章 尊严,人之为人的重要价值观 设想如下三个场景:你申请房产抵押,但被拒绝,其原因并非有人实际考察了你的情况,而是因为银行有严格的规定,认为你这种信用等级的人不能申请房产抵押;你的条件很出色,而且一家公司的面试官也觉得你很不错,但你的求职申请被拒绝了,原因是15年前你曾被判刑,而该公司明令禁止录用任何有犯罪前科的人;你被判有罪,但不能被保释,这并非由于

    待学习
    开始阅读
  • 35

    第28章 规则还是标准

    第28章 规则还是标准 如果我们的目标是减少噪声和了解如何减少噪声(或在多大程度上减少噪声),那么我们就有必要区分两种约束行为的方式:规则和标准。很多组织通常会选择其中的一种,或将两者结合起来使用。 在商业领域,某家公司可能会有以下要求:员工必须在指定的时间内工作;每个人的休假时间不能超过两个星期;如果有人将公司的秘密泄露给媒体,那么他就会被解雇。我们也可以

    待学习
    开始阅读
  • 36

    回顾与总结 正视噪声问题

    回顾与总结 正视噪声问题 噪声是我们在做判断时不希望存在的变异,然而噪声实在太多了,本书的核心目标就在于解释为何会如此,以及我们应该如何应对噪声。本书涵盖的内容十分丰富,我们在这里仅从一个宽泛的视角来对书中的核心观点进行简要的回顾和总结。 判断不是计算,也无须遵循精确的规则 需要注意的是,不要把本书中的“判断”一词与“思考”一词混淆。判断是一个相对狭义的概念

    待学习
    开始阅读
  • 37

    结语 一个噪声很少的世界

    结语 一个噪声很少的世界 请想象一下,经过重新设计并减少了噪声的组织会是什么样子。医院、招聘委员会、经济预测机构、政府机构、保险公司、公共卫生机构、刑事司法系统、律师事务所和大学,都会对噪声问题保持警觉,并努力减少这些问题。噪声审查将会成为惯例,或许每年都能进行一次。 未来,组织的领导者将会在更多领域中使用算法来代替人类判断,或将其作为人类判断的补充。人们会

    待学习
    开始阅读
  • 38

    附录1 如何进行噪声审查

    附录1 如何进行噪声审查 附录1是一份关于如何进行噪声审查的实用指南。你可以以企业顾问的视角来阅读这部分内容,设想一下这家企业雇用你来对它的一个部门员工的专业决策进行噪声审查。 顾名思义,噪声审查的重点当然在于考察噪声的普遍性,然而,良好的噪声审查其实也能提供关于员工培训和工作监管中存在的偏差、盲点和缺陷的有价值信息。成功的审查有利于促进部门改革,包括改进专

    待学习
    开始阅读
  • 39

    附录2 决策观察者检查清单

    附录2 决策观察者检查清单 本附录给出了一份决策观察者(见第19章)检查清单的通用示例。这里提供的清单大致遵循做重要决策的时间顺序。 清单中每一项之后的参考问题都对相应的项目做了进一步说明。决策观察者在审视决策过程时应该问自己这些问题。 决策观察者不应照搬照抄这个清单。我们希望它发挥的作用是为决策观察者提供灵感和基准,并使决策观察者能够据此设计出适合自己的偏

    待学习
    开始阅读
  • 40

    附录3 对抗噪声,修正预测

    附录3 对抗噪声,修正预测 匹配性预测是我们依赖直觉式匹配过程而产生的错误(参见第14章)。当我们基于现有信息做预测时,我们会进行匹配性预测,就好像我们能够依据这些信息对结果做出完美的或准确率非常高的预测一样。 让我们来回顾一下朱莉的例子,她4岁就能流利地阅读,那么她在大学时的GPA会是多少呢?如果你预测朱莉在大学时的GPA是3.8,这就意味着你从直觉上判断

    待学习
    开始阅读
  • 41

    致谢

    我们要感谢很多人。林内亚·甘地(Linnea Gandhi)是我们的参谋长,她为我们提供了大量的指导和帮助,使我们的工作可以有条不紊地推进,让我们的工作充满欢声笑语。基本可以说,是她主持了本书的撰写。除此之外,她还为本书的初稿提出了许多宝贵建议,没有她,我们无法顺利完成本书。丹·罗瓦洛对成书也起到了非常重要的作用,本书的观点最初就源于他与人合著的一篇文章。我

    待学习
    开始阅读
  • 42

    译者后记

    汪祚军 中国科学院心理研究所博士,宁波大学教授 感谢编辑部独具慧眼,能够邀请中国科学院心理研究所李纾研究员领衔本书的翻译工作。李纾老师是国内最早从事行为决策研究的专家,在行为决策领域深耕数十年,其提出的“齐当别”决策模型在心理学界具有重要的影响力。作为行为决策领域的一名研究者、李纾老师曾经的博士生,能够参与本书的翻译工作,我深感荣幸。 在拿到本书的英文原书后

    待学习
    开始阅读
  • 43

    注释

    引言 偏差与噪声,人类判断的两类错误 射击场只是一种隐喻:1778年,瑞士数学家丹尼尔·伯努利(Daniel Bernoulli)在一篇关于评估问题的论文中使用弓和箭进行了相同的类比。Bernoulli, “The Most Probable Choice Between Several Discrepant Observations and the For

    待学习
    开始阅读

Local EPUB Text

第14章 匹配,找到与你的预测最精准匹配的共识

第14章 匹配,找到与你的预测最精准匹配的共识

现在请看向天空,你认为两小时内下雨的可能性有多大?你可能很容易就答出了这个问题。你做出判断时毫不费力。你可能在不知不觉中就把对天空黑暗程度的评估转换成了概率判断。

你刚刚做的事就是一种典型的“匹配”(matching)。我们将判断描述为一种思维操作,该思维操作会为主观印象或印象的某个方面在量表上找到对应的值。匹配是该思维操作的重要组成部分。当你回答“你的心情有多好?从1分到10分,请给出你的评分”或“请对你今天早上的购物体验评分,从1颗星到5颗星”这类问题时,你就在进行匹配,你的任务是在判断量表上找到与你的心情或经历相匹配的数值。

匹配与一致性

回想一下上一章提到的比尔:比尔今年33岁,他很聪明,但缺乏想象力,而且大多数时候比较无趣。他上学的时候,数学学得很好,但人文社科类的课程的成绩却很差。我们要求你估计比尔从事各种职业和拥有各种爱好的可能性,然后我们看到你回答这个问题时用相似性判断替代了概率判断。你并没有真的去思考比尔成为会计师的可能性有多大,而是在思考他与该职业的典型形象有多相似。现在,我们转向另一个尚未解决的问题:你是如何做出这个判断的?

评估比尔的特征在多大程度上符合某个职业或某类爱好者的典型特征并不难。相比于会计师,比尔显然不像爵士乐爱好者,更不像喜欢冲浪的人。这个例子说明了匹配的非凡的通用性,在对人进行判断时,匹配的作用尤为突出。你可以回答无数有关比尔的问题。例如,如果你和他一起被困荒岛,你会有什么样的感受?仅凭得到的那么一点信息,你可能立即就会得出一个直观的答案。不过,我们还为你带来了新的信息:据我们所知,比尔恰巧是一个有超强生存技能的经验丰富的探险家。如果这个消息使你感到惊讶(很可能会如此),这就说明你刚刚经历了一致性失调。

你之所以会非常惊讶,是因为新信息与你之前所构建的比尔的形象不匹配。现在想象一下,如果最初的说明中包含关于比尔的英勇和超强生存技能的信息,那么你将对该男子形成一个完全不同的整体印象——他也许是一个只有在户外才会变得活泼的人。因为你对比尔的总体印象本来就缺乏一致性,所以将该总体印象与职业或爱好类别进行匹配就会比较困难。不过,与之前你所经历的失调相比,你现在所经历的失调要小得多。

相互矛盾的线索使达成一致变得困难,也会使在判断中找到令人满意的匹配变得困难。复杂判断的特征就是存在相互矛盾的线索,可以预料的是,我们会在其中发现很多噪声。迈克尔·甘巴迪问题就属于这一类判断,该问题中有些线索是正面的而其他线索是负面的。在第16章,我们将再次讨论复杂判断问题。在本章中,我们先将重点放在相对简单的判断,特别是那些在“强度量表”(intensity scales)上做出的判断上。

强度的匹配

在有些判断中,我们所用的量表是定性的,例如职业、爱好和医学诊断。你可以通过看它们的测量值有没有大小、多少、强弱等之分,来判断它是不是定性的,比如“红色既不比蓝色多,也不比蓝色少”。

同时,也有许多判断的量表是定量的。比如,尺寸、重量、亮度、温度或响度等物理量的测量,成本或价值的测量,概率或频率的判断等都属于定量测量。还有一些抽象的判断也是定量测量,如信心、力量、吸引力、愤怒、恐惧、不道德、惩罚的严厉程度等。

这些可以量化的维度有一个共同特征:对于在同一维度上的任意两个数值,都可以比较“哪个更多”。你知道鞭笞是比打手心更严厉的惩罚,你也知道自己更喜欢《哈姆雷特》而不是《等待戈多》,就像你知道太阳比月亮更明亮,大象比仓鼠更重,美国迈阿密的平均气温比加拿大多伦多的更高是一样的。

人类具有非凡的直觉力,可以对比两个强度不同的量表,从而将两个完全无关维度的强度相匹配。你可以将自己对不同歌手的感情强度与城市建筑物的高度相匹配。例如,如果你特别喜欢鲍勃·迪伦(Bob Dylan),那么你可以将自己对他的热情与你所在城市的建筑物的高度进行匹配。你还可以将你所在国家或地区当下的政局紧张程度与夏季的气温相匹配。如果要求你用一本小说的长度来度量一家餐厅的美味程度,而不是让你给出常见的1~5颗星的评分,这种要求会让你觉得很奇怪,但并非完全不可行。在这种情况下,你依然能很清楚地表达你的意思。

在日常交谈中,量表的取值范围通常依赖于情境。比如对于“他攒了很多钱”这句话,如果你是在一位成功银行家的退休宴会上敬酒时说出的,那么它表达的含义与你在祝贺一位正在兼职做保姆的年轻人时说出的大不相同。“大”和“小”这类形容词的含义完全取决于参照系,“大老鼠从小象的鼻子上跑了下来”这句话能让我们深刻体会到这一点。

匹配性预测的偏差

接下来的这个难题说明了匹配的力量以及与之相关的系统性判断错误。

朱莉是一所大学的应届毕业生。请阅读下列有关她的信息,然后猜测她的GPA是多少(标准分数为0~4.0分):

朱莉4岁时能流利阅读。

她的GPA是多少?

如果你熟悉美国的成绩系统,那么你脑子里很快就会蹦出一个数字,这个数字很可能为3.7或3.8。你是如何快速得出这一结果的?这一猜测过程正好说明了我们刚刚描述的匹配系统。

第一步,你评估了朱莉在阅读上的早慧程度。这很简单,因为朱莉在很小的时候就能流利阅读了,这种早慧使朱莉被划分在了某个量表的某个类别之中。如果必须描述你所使用的这个量表,你可能会说它的最高类别是“极其早慧”,并且你也知道朱莉不属于这个最高类别(有些孩子在两岁之前就会阅读了),朱莉很可能属于次一级的类别,在这个类别中,孩子们虽然非常早慧但不算极其早慧。

第二步,你要判断出一个GPA值,使它能与你对朱莉早慧程度的评估相匹配。尽管你是无意识的,但你一定会寻找一个GPA值,使得它看起来符合“非同寻常但不是极其特别”这个标签。当你听到朱莉的故事时,你自然而然地就在脑海里进行了这种匹配性预测。

在执行这些评估和匹配任务时,人们如果刻意地去运算,将会花费相当长的时间,而通过系统1思维的快速思考,则可以迅速而轻松地做出判断。我们在这里讲的有关猜测朱莉的GPA的故事涉及复杂的、多阶段的心理过程,无法直接观察。“匹配”这种特殊的心理机制在心理学中虽然不常见,但支持它的证据是毋庸置疑的。我们可以确定,就如下两个问题,不管你问谁,你得到的答案都会是完全相同的两个数字,因为我们已经做了许多类似的实验。

· 朱莉所在的班级里,比她更早开始阅读的人占了多大的比例?

· 朱莉所在的班级里,比她的GPA更高的人占了多大的比例?

第一个问题很好解答:它只要求你基于现有的信息对朱莉进行评估。第二个问题需要我们对未来进行预测,当然会更困难些,但是我们的直觉思维会使我们情不自禁地用第一个问题的答案来回答第二个问题。

关于朱莉的这两个问题类似于我们先前在讨论效度错觉时描述的那两个向来容易混淆的问题。在关于朱莉的问题中,第一个问题要求你基于现有的信息评估“强度”;第二个问题询问的则是预测的强度。我们猜测,两个问题很难被区分开来。

对朱莉GPA的直觉性预测可以看作我们在第13章中介绍的心理机制的一个例子:用一个简单问题替代一个困难问题。你的系统1思维回答了一个简单得多的问题,把一个困难的预测问题简化成了:朱莉在4岁时就能阅读了,这多么令人印象深刻啊!在此之后,要把阅读早慧程度直接与GPA相对应,还需要一个步骤——匹配。

当然,只有当获得的信息与问题有关时,才会发生替代。如果你只知道朱莉跑得很快或她跳舞水平一般,在评估GPA的问题上你就一点信息都没有了。但是,任何看起来像是可以测量才智的指标都可能是可用的替代品。

用一个问题替代另一个问题时,如果两个问题的正确答案不一样,错误就会不可避免地产生。用阅读早慧程度代替GPA,尽管看似合理,但其实质是非常荒谬的。要想知道为什么,就想一想朱莉4岁以后可能会发生的事情。她有可能会经历一场可怕的事故,她的父母有可能会发生一场极不愉快的离婚风波,她也可能会遇到经常鼓励她的好老师,从而对她的人生产生巨大影响。总之,太多的事件都有可能会影响她上大学时的学业成绩。

只有当阅读早慧程度和大学的GPA完全相关时,匹配性预测才可能是正确的,然而,事实显然并非如此。另外,完全不考虑朱莉的阅读早慧程度这一信息的做法也是错误的,因为她的阅读早慧程度确实提供了一些有用信息。最佳预测应该介于拥有完整信息时的预测和完全没有相关信息时的预测这两个极端之间。

当你只知道案例所属的类别,而对其他具体情况一无所知时,你对该案例能了解些什么?答案就是我们所谓的案例外部视角。如果要我们预测朱莉的GPA但不提供有关她的信息,那么我们肯定会预测GPA的平均值——可能是3.2,这就是外部视角的预测。因此,朱莉GPA的最佳估计值应该为3.2~3.8分。估计值的具体位置取决于信息的预测价值:你越相信阅读年龄可以作为GPA的预测因素,你的估计值就越高。就这一问题而言,信息的预测价值肯定是很薄弱的,因此最合理的预测应该接近平均GPA。有一种非常简单的技术可以纠正匹配性预测的误差,我们将在附录3中详细介绍。

我们总是难以抗拒地做出与证据相匹配的预测,尽管这种预测从统计学上看很荒谬。比如,销售经理通常会认为,去年表现比其他人更优秀的销售人员会在今年继续表现突出。有时候,当高管遇到才华横溢的应聘者时,他就会设想这位新员工将如何从企业底层晋升到最高层。制片人通常会认为:那些上一部电影大获成功的导演,他们的下一部电影也会取得成功。

上述这些匹配性预测的例子很有可能会以失败告终。另外,当情况糟糕时,匹配性预测的结果可能会过度消极。无论是过度乐观还是过度悲观,与证据进行匹配的直觉性预测往往太过极端。描述这种预测误差的一个术语叫作“非回归性”(nonregressive),因为它们没有考虑到“均值回归”(regression to the mean)这一统计现象。

然而,需要注意的是,替代和匹配并不总会影响预测。从双系统的角度来说,直觉性的系统1思维为出现的问题提供了快速的解决方案,但是这些直觉性思维必须经过反思性的系统2思维的认可,才会被转换成信念。有时候,人们会偏好复杂性思维的反馈,而拒绝匹配性的预测。例如,相比于积极的证据,人们不太愿意对消极的证据进行匹配性预测。我们猜测,如果朱莉开始阅读的时间较晚的话,你可能就不会那么毫不犹豫地做出匹配性预测,即认为她的大学成绩差了。当获得的信息增多时,这种积极预测和消极预测之间的不对称性将逐渐消失。

我们可以通过外部视角来纠正各种直观预测。例如,在前面关于迈克尔·甘巴迪的未来前景的讨论中,我们建议你将对甘巴迪的成功概率的判断锚定在基准概率(新任CEO任期持续两年的成功率)上。对于诸如朱莉的GPA的定量预测,采取外部视角意味着将你的预测锚定在平均结果上。只有在非常简单的问题中,在可以非常确信基于当前的信息能够完美做出预测时,我们才可以忽略外部视角,而当需要做出认真严肃的判断时,我们必须考虑外部视角。

匹配中的噪声:绝对判断的局限性

我们在强度量表上区分类别的能力有限,这限制了匹配的准确性。在大小或财富维度上,有很多数值都可以被划分到“大”或“富”这种类别中,这是重要的潜在噪声源。

用富有来描述退休的投资银行家是没错的,但他到底有多富有呢?有许多形容词可供我们选择:小康、经济宽裕、富裕、超级富裕等。如果给你提供许多人的财富信息,并要求你用一个形容词来形容每个人,而且不能对每个人的财富进行比较和排序,你可以分出多少种不同的类别?

发表于1956年的一篇有历史意义的经典心理学论文《神奇的数字7,加2或减2》(The Magical Number Seven,Plus or Minus Two),其标题就指出了我们在强度量表上可以区分的类别数。如果类别数超出这一范围,人们就会开始犯错——例如,人们会认为A应当划分到比B更高级的类别中,但也会在一对一的比较时给予B高于A的评分。

请想象4条长度不等的5~10厘米的线段,这4条线段的长度呈等差分布。你每次只能看到其中的一条线段,你需要用数字1—4来评估该线段的长度:1表示最短,4表示最长。这个任务很简单。假设现在有5条长度不等的线段,重复这个过程,用数字1—5来评估线段的长度。这个任务仍然很容易。随着线段的增多,你从什么时候开始会犯错误呢?大约是从有7条线段时开始,7真是个神奇的数字!令人惊讶的是,该数字几乎不受线段长度范围的影响:如果线段的长度为5~15厘米,而不是5~10厘米,你仍然会在有7条线段之后开始犯错。当你听到不同大小的声音或看到不同亮度的光时,情况也是类似的。人们在同一维度上对不同刺激赋予不同类别标签的能力有一个限度:大约是7个标签。

这种区分能力的限度很重要,因为我们在不同维度上对强度值进行匹配的能力,应该不会比直接在这些维度上指定数值的能力更强。虽然匹配操作是快速的系统1思维的一种通用工具,也是许多直觉性判断的核心,但它是很粗糙的。

不过,神奇的数字7并不是一个绝对的限度,人们可以通过训练层级分类来对标签做出更好的区分。例如,在千万富翁这一群体中,我们又可以区分出好几种不同富裕程度的类别,法官也可以在重型犯罪中区分出多种不同严重程度的类别。但是,要使这种优化过程起作用,类别必须是事先存在并且边界定义清晰的。在为一组线段赋予标签时,我们很难将较长的线段与较短的线段区分开,并将它们视为两个单独的类别,因为当我们处于快速的系统1思维模式时,分类并不受主观意志控制。

有一种方法可以克服形容词量表在分辨能力上的局限性:进行对比,而不是使用标签,因为我们比较案例的能力比评价案例的能力强得多。

假设让你用一个20分制的量表来评价许多餐厅或歌手,你会如何做呢?5分制的量表很容易把握,但是20分制的量表将很难保证你的评价的可信度。比如,在5分制的量表下我们可以给Joe’s Pizza餐厅打3分,但是用20分制的量表时,我们该给11分还是12分呢?解决这个问题的方法很简单,但是你需要花费很多时间才能做出判断。

首先,你要用一个5分制的量表对餐厅或歌手进行评分,将其分为5类。然后,你要在每个类别中对不同的对象进行排序,通常只需做几次对比即可完成:你可能知道你更偏爱Joe’s Pizza餐厅还是Fred’s Burgers餐厅,以及更喜欢歌手泰勒·斯威夫特(Taylor Swift)还是鲍勃·迪伦,尽管你将它们(他们)划分在了同一种类别下。一个更简单的方法是,你可以将5个类别再分为4个等级。即使是对那些你最不喜欢的歌手,你可能也可以区分出几种不同等级的厌恶程度。

上述行为的心理机制很简单:对判断对象进行直接比较能够获得比逐一评估各个对象更精确的区分效果。判断线段长度也是同样的道理:我们比较不同线段长度的能力要比确认某个具体的线段长度的能力强得多,此外,我们在比较两条线段的长度时,准确性也会更高。

我们在比较判断方面的优势适用于许多领域。如果你对人们的财富水平只有粗略的认知,那么相比于逐一标记每个人的财富水平,在同一范围内对不同个体的财富水平进行比较会更为清晰、容易。如果你对文章进行评分,那么将文章从最优到最差进行排序会比对文章逐一阅读和评分更为精确。比较判断和相对判断要比分类判断和绝对判断更敏锐,不过,正如上述的例子所表明的那样,前者也更费时费力。

使用明确有可比性的量表对目标进行单独评估,能够保留比较判断的一些优势。在某些情况下,特别是在教育领域,涉及入选录用或升迁推荐时,推荐人通常需要将候选人限定为某一类人群(如“自己教过的学生”或“具有相同经验水平的教师”)的前5%或前20%。但是,推荐人给出的评估值可能没有太大的参考价值,因为我们无法保证推荐者始终规范地使用统一的量表。当然,在某些情况下这些评估值还是有用的,比如,当经理对员工进行评级或分析师对投资进行评估时,可以先找到那些将90%的对象都划分到“前20%”这个类别中的人并纠正他们的错误。使用比较判断是减少噪声的方法之一,我们将在本书第五部分对此进行讨论。

许多判断任务都需要将考查对象与量表上的某个类别进行匹配,或者使用一组有序的形容词,比如用“不太可能”或“极不可能”来评定事件发生的概率。然而,这种匹配其实很粗糙,因此充满了噪声。即使人们对判断的实质达成了共识,每个人对标签的理解也可能有所不同。即便如此,强制进行比较判断还是可能减少噪声。在下一章,我们将进一步探讨错误地使用量表会如何增加噪声。