学习进度

0%

阅读时长

未满 1 分钟

最近阅读:未开始阅读

核心概念

待提炼

章节学习

  • 1

    献词

    献给诺加、奥里和吉利 ——丹尼尔·卡尼曼 献给范丁和莱莉亚 ——奥利维耶·西博尼 献给萨曼莎 ——卡斯·R.桑斯坦

    待学习
    开始阅读
  • 2

    重磅赞誉

    从“偏差”到“噪声”,作为心理学家的卡尼曼,挑战的是经济学的“理性人”假设,并因开启了行为经济学的大门而获得诺贝尔经济学奖。他一直关注的是人类在决策中是如何犯错的,在这本书中,他深入分析了噪声的影响,但也乐观地预期,可以通过发掘埋没在大数据中的信息来减少决策中的噪声,这可以说是大数据渗透到行为经济学领域的新趋势。 巴曙松 北京大学汇丰金融研究院执行院长,中国

    待学习
    开始阅读
  • 3

    测一测 如何做一个聪明的决策者?

    测一测 如何做一个聪明的决策者? 想知道你的判断 是怎么掉入噪声陷阱的吗? 扫码测一测, 立即获取答案及解析, 看看你的“降噪等级”。 1.卡尼曼是世界上第一个凭借心理学研究获得诺贝尔经济学奖的人。这个说法对吗? A.对 B.不对 2.卡尼曼指出:人类判断出错的原因有两种。一种是偏差,另一种是什么呢? A.误差 B.噪声 C.系统认知 3.在做一个判断时,以

    待学习
    开始阅读
  • 4

    推荐序1 在无法回避噪声的世界,更好地追求高级境界与极致效益

    推荐序1 Preface 在无法回避噪声的世界, 更好地追求高级境界与极致效益 彭凯平 清华大学社会科学学院院长 每年七八月份,我都会参加清华大学的本科生招生工作,由此而目睹了一个问题:高考揭榜之后,高中毕业生及其家长应如何做好志愿填报?学校和专业的选择非常重要,很有可能会决定一个学生一辈子的命运,其中牵涉的问题就与我们心理学中一个重要的研究领域紧密相关,那

    待学习
    开始阅读
  • 5

    推荐序2 穿越噪声的决策

    推荐序2 Preface 穿越噪声的决策 朱宁 上海交通大学上海高级金融学院金融学教授,副院长 我抱着浓厚的兴趣读完了诺贝尔经济学奖得主丹尼尔·卡尼曼教授等的新作《噪声》一书,这本书汇集了卡尼曼教授近十年的最新发现。对于我所从事的行为金融学研究领域而言,《噪声》算得上是一本“专业书”,但是读完之后,我认为它很可能是卡尼曼教授继《思考,快与慢》后,又一次成功将

    待学习
    开始阅读
  • 6

    中文版序 哪里有判断,哪里就有噪声

    中文版序 Preface 哪里有判断,哪里就有噪声 我们非常荣幸,也非常感激,能够在中国出版这本书。《噪声》重点关注人类的判断,关注它是如何出错的,以及如何让它变得更好。无论是医学、法律、公共政策、商业,还是日常生活领域中,我们做出判断的过程中存在的问题,是偏好根据经验做判断的人类的共性问题。 数十年来,偏差问题备受瞩目。在《思考,快与慢》一书中,本书的作者

    待学习
    开始阅读
  • 7

    引言 偏差与噪声,人类判断的两类错误

    引言 Introduction 偏差与噪声,人类判断的两类错误 试想一下,你的朋友组成了A、B、C、D共4支队伍,来到一个射击场。每队中有5个人,他们共用一支来复枪,且每人只开了一枪。图0-1显示了他们的射击结果。 图0-1 4支队伍的射击结果 理想情况是,每一枪都能正中靶心。 A队几乎达到了理想情况,他们的每一发子弹都紧紧围绕着靶心,接近完美模式。 B队的

    待学习
    开始阅读
  • 8

    第1章 犯罪和充满噪声的判罚

    第1章 犯罪和充满噪声的判罚 假设某人被指控犯了罪,例如到商店行窃、私藏海洛因、袭击他人或持枪抢劫,该案件可能的判决结果是什么? 答案不应取决于该案件恰巧被指派给哪位法官、天气是冷是热,以及当地球队在前一天是输是赢。如果3个背景类似的人被指控犯有同一罪行,最后却得到截然不同的处罚,例如第一个人被判缓刑,第二个人被判2年有期徒刑,最后一个人被判10年有期徒刑,

    待学习
    开始阅读
  • 9

    第2章 系统噪声,给人达成一致的错觉

    第2章 系统噪声,给人达成一致的错觉 我们最初接触噪声,并对这个主题产生兴趣,并不是因为遇到了像刑事司法案件那般富有戏剧性的案例。实际上,这次邂逅纯属偶然,缘于一家保险公司,这家公司与我们中的两人所属的咨询公司有合作。我们的研究揭示了营利性组织中存在噪声问题的严重性——组织会因为决策中的噪声损失惨重。我们在保险公司的经历有助于解释为什么噪声问题常常被忽视,以

    待学习
    开始阅读
  • 10

    第3章 单一决策,仅发生一次的重复决策

    第3章 单一决策,仅发生一次的重复决策 到目前为止,我们所讨论的案例研究都与重复决策相关。比如,对盗窃犯的恰当判决是什么?对某一特定风险该收取多少保费?虽然每个具体的案例在某种意义上都是独特的,但像这样的判断属于重复决策。医生诊断患者,法官审理假释案件,招生人员审查入学申请书,会计师准备税单等,这些都是重复决策。 正如前一章所介绍的,重复决策中的噪声可以通过

    待学习
    开始阅读
  • 11

    第4章 什么是判断

    第4章 什么是判断 本书论述的是一般意义上的专业判断,我们假设如果做判断的人有足够的能力,就能做出准确的判断。然而,判断这一概念本身包含着一个你不得不承认的事实:你永远无法确定一个判断是不是准确。 请思考“判断问题”和“主观判断”这两个短语的差别。我们认为“太阳明天会升起”或“NaCl是氯化钠的化学式”这样的陈述并非判断,因为任何理性的人都会完全同意上述观点

    待学习
    开始阅读
  • 12

    第5章 测量误差,噪声与偏差的代价一样大

    第5章 测量误差,噪声与偏差的代价一样大 显而易见的是,一致性的偏差会引发代价高昂的错误。如果体重秤在你每次称体重时都自动加上一定的重量,如果一位乐观的经理总是预测项目只需花费实际所需时间的一半,如果一位谨小慎微的经理总是年复一年地低估未来的销售额,那么后果都将会非常严重。 我们已经知道,噪声会引发代价高昂的错误。如果一位经理大多数时候预测的项目所需时间只是

    待学习
    开始阅读
  • 13

    第6章 噪声分析:所有判断都存在3类噪声

    第6章 噪声分析:所有判断都存在3类噪声 在上一章,我们讨论了单个案例中测量或判断的变异性。在单个案例中,判断的所有变异性都是误差,而误差由偏差和噪声组成。我们考察的判断系统,包括法院和保险公司的判断系统,它们的目的在于处理不同案例,并对这些案例进行区分。如果美国的联邦法官和保险理赔员对他们手头的所有案例都做出相同的判断,那他们就没有什么存在的价值了。对不同

    待学习
    开始阅读
  • 14

    第7章 情境噪声,无时无刻不在影响着我们的判断

    第7章 情境噪声,无时无刻不在影响着我们的判断 想象一名职业篮球运动员正在准备罚球的场景:他站在罚球线上,全神贯注地准备投篮。这是他练习过无数次的一系列动作,他能投中吗?我们无法预知结果。 在NBA的比赛中,球员们通常能够4罚3中。显然,一些球员比其他球员表现得更好,但没有人能做到百发百中(3)。虽然篮筐一直都是距离地面3.05米,与罚球线的垂直距离一直是4

    待学习
    开始阅读
  • 15

    第8章 群体是如何放大噪声的

    第8章 群体是如何放大噪声的 个体判断中存在噪声的结果已经很糟糕了,但群体决策中的噪声危害更甚。群体决策可能会由于一些无关因素而朝任何一个方向改变。谁先发言、谁后发言,谁说话更自信,谁穿着黑色衣服,谁和谁挨着坐,谁在某个时刻笑了/皱眉了/呈现出其他身体姿势……所有这些因素都会影响结果。相似的群体每一天都会做出各种不同的决策,如雇用、晋升、破产、沟通策略、环境

    待学习
    开始阅读
  • 16

    第9章 判断与模型,简单的模型普遍优于人类判断

    第9章 判断与模型,简单的模型普遍优于人类判断 很多人都对预测未来的工作绩效感兴趣,不只是自己的,还有别人的。因此,绩效预测是用来考察预测性判断的实用例子。例如,一家大公司在招聘高管时,聘请了一家专业咨询公司对两名候选人莫妮卡和娜塔莉进行评估,并以取值为1~10分的量表对两人的领导力、沟通能力、人际交往能力、职业技能、应聘动机等维度进行打分(见表9-1)。你

    待学习
    开始阅读
  • 17

    第10章 无噪声的规则

    第10章 无噪声的规则 近年来,人工智能(Artificial Intelligence)特别是机器学习技术让机器能够执行许多以前只有人类才能执行的任务。机器学习算法可以承担人脸识别、语言翻译、分析医学影像等任务,并且可以以惊人的速度和准确性来处理计算问题,例如为成千上万名驾驶员迅速规划行车路线。它们还可以执行困难的预测任务:预测美国最高法院的判决;识别哪些

    待学习
    开始阅读
  • 18

    第11章 哪里有预测,哪里就有客观无知

    第11章 哪里有预测,哪里就有客观无知 我们经常同一些公司高管分享第9章和第10章中的研究内容,并通过发人深省的发现让他们意识到人类的判断是有限的。这些发现已经存在了半个多世纪,应该很少有人能避开它们,但人们仍然对这些发现很抵触。 在我们的听众里,有一些高管会很自豪地告诉我们,相比于定量分析,他们更相信自己的直觉;其他人虽然没明说,但他们也有同样的看法。有关

    待学习
    开始阅读
  • 19

    第12章 常态谷:事情虽无法预测,但可以被理解

    第12章 常态谷:事情虽无法预测,但可以被理解 现在我们来考虑一个更大的问题:在这个世界上,有些问题容易解决,有些问题却充满了客观无知,那我们应如何自处呢?毕竟,在存在很严重的客观无知的情况下,我们很快就能意识到,用水晶球来预测未来是徒劳的,但我们通常并不会对这个世界产生这种体验。相反,正如上一章所提到的,我们一直在基于少量的有用信息来对未来做出大胆预测。在

    待学习
    开始阅读
  • 20

    第13章 启发式、偏差与噪声

    第13章 启发式、偏差与噪声 本书是对横跨半个世纪的关于人类直觉判断研究的延续,也就是所谓的“启发式和偏差研究项目”(heuristics and biases program)。《思考,快与慢》一书对该研究项目前40年的研究内容进行了回顾,探讨了能够解释“直觉思维的奇妙与缺陷”的心理机制。该项目的核心思想是,当回答一个难题时,人们会使用简化的思维操作系统—

    待学习
    开始阅读
  • 21

    第14章 匹配,找到与你的预测最精准匹配的共识

    第14章 匹配,找到与你的预测最精准匹配的共识 现在请看向天空,你认为两小时内下雨的可能性有多大?你可能很容易就答出了这个问题。你做出判断时毫不费力。你可能在不知不觉中就把对天空黑暗程度的评估转换成了概率判断。 你刚刚做的事就是一种典型的“匹配”(matching)。我们将判断描述为一种思维操作,该思维操作会为主观印象或印象的某个方面在量表上找到对应的值。匹

    待学习
    开始阅读
  • 22

    第15章 选取精确的量表,并多用相对判断

    第15章 选取精确的量表,并多用相对判断 假设你是民事审判案件中的一名陪审员。你目前所掌握的证据大致如下,你要据此做出判断。 琼·格洛弗(Joan Glover)诉General Assistance公司案 一个名叫琼·格洛弗的6岁小女孩吞下了大量非处方抗过敏药AllerFree,需要住院治疗很长时间。大剂量的药物使她的呼吸系统变得很脆弱,因此她很容易患上哮

    待学习
    开始阅读
  • 23

    第16章 模式噪声的构成

    第16章 模式噪声的构成 还记得朱莉吗?我们在第14章中提到的那个早慧的孩子。你曾尝试预测她的大学GPA。以下是有关朱莉的详细介绍。 朱莉是独生女。她的父亲是一位事业有成的律师,母亲是一位建筑师。朱莉大约3岁时,她的父亲患上了一种自体免疫性疾病,不得不居家办公。他花大量的时间陪伴朱莉,并耐心地教她读书识字。朱莉4岁时就能流畅地阅读。她的父亲也曾尝试教她算术,

    待学习
    开始阅读
  • 24

    第17章 噪声源,偏差是引人注目的图形,而噪声是不受我们关注的背景

    第17章 噪声源,偏差是引人注目的图形,而噪声是不受我们关注的背景 哪里有判断,哪里就有噪声,希望你现在也认同这一观点。我们也希望,对你而言这已不再是一件超乎想象的事。这也正是我们着手开展研究的主要动力。经过多年的努力,我们对这个问题的思考已经逐渐深入和完善。现在,来回顾一下我们已经了解的噪声成分、这些成分对噪声的重要影响以及它们在判断中所起的作用。 噪声成

    待学习
    开始阅读
  • 25

    第18章 卓越的判断者,卓越的判断力

    第18章 卓越的判断者,卓越的判断力 至目前为止,我们主要谈论的是人类的判断,而没有对不同的判断者进行区分。显然,在任何一项任务中,有些人做出的判断要优于其他人。即使是由群体做出的判断,如果该群体由高能力个体组成,那么最终的判断也会更优。这就引出了一个重要的问题,即如何甄别出更好的判断者。 有三件事至关重要。如果做判断的人受过良好的训练、更睿智且拥有正确的认

    待学习
    开始阅读
  • 26

    第19章 消除偏差与决策卫生

    第19章 消除偏差与决策卫生 许多研究人员和机构都力图减少判断偏差。在本章中,我们将分析他们的核心发现。我们将介绍消除偏差的各类干预措施之间的区别,并探讨其中一种值得进一步研究的干预措施。随后,我们将讨论如何减少噪声,并介绍决策卫生的概念。 干预:事后及事前消除偏差 减少偏差有两种主要方式,要描述它们的特点,一个好方法是回到测量类比。假设你家浴室里的体重秤在

    待学习
    开始阅读
  • 27

    第20章 司法科学,信息排序是最大的噪声

    第20章 司法科学,信息排序是最大的噪声 2004年3月,在西班牙首都马德里,一组被放置在通勤列车上的炸弹爆炸,造成192人死亡,2000多人受伤。人们在犯罪现场的塑料袋上发现了一枚指纹,并通过国际刑警组织将其传送到了世界各地的执法机构。几天后,美国联邦调查局(FBI)犯罪实验室最终确认这枚指纹属于一个居住在俄勒冈州的美国公民布兰登·梅菲尔德(Brandon

    待学习
    开始阅读
  • 28

    第21章 甄选与汇总,超级预测的两大策略

    第21章 甄选与汇总,超级预测的两大策略 许多判断都涉及预测,比如,下个季度的失业率可能是多少?明年将售出多少辆电动汽车?2050年的气候变化会带来什么影响?盖完一幢新楼需要多长时间?某家公司的年收入是多少?新员工会有什么样的表现?新的空气污染管理制度的成本是多少?谁将赢得选举?这些问题的答案会产生重大影响,因为私人机构和公共机构的一些重要选择往往取决于这些

    待学习
    开始阅读
  • 29

    第22章 医疗决策,用科学的诊断指南减少噪声

    第22章 医疗决策,用科学的诊断指南减少噪声 几年前,我们的一位好朋友保罗被他的主治医师琼斯诊断为患有高血压。琼斯医生建议保罗尝试药物治疗,他给保罗开了利尿剂,但保罗的血压依旧很高,也就是说药物没起到效果。几个星期后,琼斯又开了第二种药物——钙通道阻滞剂,但效果依然不理想。 这些结果使琼斯困惑不已。虽然过去的3个月保罗每星期都会来复诊,但他的血压只是略有下降

    待学习
    开始阅读
  • 30

    第23章 绩效评估,用基于外部视角的共识框架做出量化判断

    第23章 绩效评估,用基于外部视角的共识框架做出量化判断 让我们从一个练习开始:请选出3个你认识的人,他们可以是你的朋友或同事。请在友善、智慧和勤奋这3种特质上给他们进行1~5分的评分,其中1分是最低分,5分是最高分。现在再请另一个很了解他们的人(这个人可以是你的配偶、好友或者最亲密的同事)用同样的方式对这3个人进行评分。 在某些评估中,你和其他评分者很可能

    待学习
    开始阅读
  • 31

    第24章 人员招聘,以结构化指标衡量人才

    第24章 人员招聘,以结构化指标衡量人才 如果你曾经找过工作,那么“招聘面试”这个词可能会唤起你的一些生动而紧张的回忆。工作面试,即求职者与未来的主管或人力专员会面,是进入许多组织的必经之路。 在大多数情况下,面试遵循着既定的流程。在寒暄之后,面试官会要求应聘者描述他们的个人经历,或者详细地描述他们经历过的某些特定情形。再问一些诸如个人成就与挑战、工作动机以

    待学习
    开始阅读
  • 32

    第25章 中介评估法,做出明智决策的核心方法

    第25章 中介评估法,做出明智决策的核心方法 不久前,我们两个人(卡尼曼和西博尼)与我们的朋友丹·罗瓦洛(Dan Lovallo)一起,介绍过组织中使用的一种决策方法。这一方法的首要目的在于减少噪声,我们称之为中介评估法。该方法涵盖了我们前几章所介绍的大多数决策卫生策略,并且它的应用范围很广泛,只要在计划或选项的评估过程中需要考虑和权衡多维度信息,我们就可以

    待学习
    开始阅读
  • 33

    第26章 减少噪声的成本

    第26章 减少噪声的成本 每当我们建议人们消除噪声时,他们可能会以成本过高为由进行反对,并认为在极端情况下,减少噪声根本不可能。我们已经在商业、教育、政府以及其他领域听到过这种反对意见,这种观点虽然有一定的合理性,但言过其实了,或者只不过是一个借口。 为了证明我们的这种反对意见更有说服力,举一个高中老师为文章评分的例子。有位高中老师每星期都要对学生撰写的25

    待学习
    开始阅读
  • 34

    第27章 尊严,人之为人的重要价值观

    第27章 尊严,人之为人的重要价值观 设想如下三个场景:你申请房产抵押,但被拒绝,其原因并非有人实际考察了你的情况,而是因为银行有严格的规定,认为你这种信用等级的人不能申请房产抵押;你的条件很出色,而且一家公司的面试官也觉得你很不错,但你的求职申请被拒绝了,原因是15年前你曾被判刑,而该公司明令禁止录用任何有犯罪前科的人;你被判有罪,但不能被保释,这并非由于

    待学习
    开始阅读
  • 35

    第28章 规则还是标准

    第28章 规则还是标准 如果我们的目标是减少噪声和了解如何减少噪声(或在多大程度上减少噪声),那么我们就有必要区分两种约束行为的方式:规则和标准。很多组织通常会选择其中的一种,或将两者结合起来使用。 在商业领域,某家公司可能会有以下要求:员工必须在指定的时间内工作;每个人的休假时间不能超过两个星期;如果有人将公司的秘密泄露给媒体,那么他就会被解雇。我们也可以

    待学习
    开始阅读
  • 36

    回顾与总结 正视噪声问题

    回顾与总结 正视噪声问题 噪声是我们在做判断时不希望存在的变异,然而噪声实在太多了,本书的核心目标就在于解释为何会如此,以及我们应该如何应对噪声。本书涵盖的内容十分丰富,我们在这里仅从一个宽泛的视角来对书中的核心观点进行简要的回顾和总结。 判断不是计算,也无须遵循精确的规则 需要注意的是,不要把本书中的“判断”一词与“思考”一词混淆。判断是一个相对狭义的概念

    待学习
    开始阅读
  • 37

    结语 一个噪声很少的世界

    结语 一个噪声很少的世界 请想象一下,经过重新设计并减少了噪声的组织会是什么样子。医院、招聘委员会、经济预测机构、政府机构、保险公司、公共卫生机构、刑事司法系统、律师事务所和大学,都会对噪声问题保持警觉,并努力减少这些问题。噪声审查将会成为惯例,或许每年都能进行一次。 未来,组织的领导者将会在更多领域中使用算法来代替人类判断,或将其作为人类判断的补充。人们会

    待学习
    开始阅读
  • 38

    附录1 如何进行噪声审查

    附录1 如何进行噪声审查 附录1是一份关于如何进行噪声审查的实用指南。你可以以企业顾问的视角来阅读这部分内容,设想一下这家企业雇用你来对它的一个部门员工的专业决策进行噪声审查。 顾名思义,噪声审查的重点当然在于考察噪声的普遍性,然而,良好的噪声审查其实也能提供关于员工培训和工作监管中存在的偏差、盲点和缺陷的有价值信息。成功的审查有利于促进部门改革,包括改进专

    待学习
    开始阅读
  • 39

    附录2 决策观察者检查清单

    附录2 决策观察者检查清单 本附录给出了一份决策观察者(见第19章)检查清单的通用示例。这里提供的清单大致遵循做重要决策的时间顺序。 清单中每一项之后的参考问题都对相应的项目做了进一步说明。决策观察者在审视决策过程时应该问自己这些问题。 决策观察者不应照搬照抄这个清单。我们希望它发挥的作用是为决策观察者提供灵感和基准,并使决策观察者能够据此设计出适合自己的偏

    待学习
    开始阅读
  • 40

    附录3 对抗噪声,修正预测

    附录3 对抗噪声,修正预测 匹配性预测是我们依赖直觉式匹配过程而产生的错误(参见第14章)。当我们基于现有信息做预测时,我们会进行匹配性预测,就好像我们能够依据这些信息对结果做出完美的或准确率非常高的预测一样。 让我们来回顾一下朱莉的例子,她4岁就能流利地阅读,那么她在大学时的GPA会是多少呢?如果你预测朱莉在大学时的GPA是3.8,这就意味着你从直觉上判断

    待学习
    开始阅读
  • 41

    致谢

    我们要感谢很多人。林内亚·甘地(Linnea Gandhi)是我们的参谋长,她为我们提供了大量的指导和帮助,使我们的工作可以有条不紊地推进,让我们的工作充满欢声笑语。基本可以说,是她主持了本书的撰写。除此之外,她还为本书的初稿提出了许多宝贵建议,没有她,我们无法顺利完成本书。丹·罗瓦洛对成书也起到了非常重要的作用,本书的观点最初就源于他与人合著的一篇文章。我

    待学习
    开始阅读
  • 42

    译者后记

    汪祚军 中国科学院心理研究所博士,宁波大学教授 感谢编辑部独具慧眼,能够邀请中国科学院心理研究所李纾研究员领衔本书的翻译工作。李纾老师是国内最早从事行为决策研究的专家,在行为决策领域深耕数十年,其提出的“齐当别”决策模型在心理学界具有重要的影响力。作为行为决策领域的一名研究者、李纾老师曾经的博士生,能够参与本书的翻译工作,我深感荣幸。 在拿到本书的英文原书后

    待学习
    开始阅读
  • 43

    注释

    引言 偏差与噪声,人类判断的两类错误 射击场只是一种隐喻:1778年,瑞士数学家丹尼尔·伯努利(Daniel Bernoulli)在一篇关于评估问题的论文中使用弓和箭进行了相同的类比。Bernoulli, “The Most Probable Choice Between Several Discrepant Observations and the For

    待学习
    开始阅读

Local EPUB Text

第11章 哪里有预测,哪里就有客观无知

第11章 哪里有预测,哪里就有客观无知

我们经常同一些公司高管分享第9章和第10章中的研究内容,并通过发人深省的发现让他们意识到人类的判断是有限的。这些发现已经存在了半个多世纪,应该很少有人能避开它们,但人们仍然对这些发现很抵触。

在我们的听众里,有一些高管会很自豪地告诉我们,相比于定量分析,他们更相信自己的直觉;其他人虽然没明说,但他们也有同样的看法。有关管理决策的研究表明,高管通常会凭直觉、感受或简单的判断(此处的判断与本书中“判断”一词的含义不同)来行事,尤其是级别较高的、经验丰富的高管。

简而言之,决策者喜欢听从自己的直觉,且多数人对直觉传递出的信息颇为满意。这里存在一个问题:这些极其自信的权威人士究竟从他们的直觉中“听”到了什么呢?

一篇有关管理决策中的直觉的综述性文章,将直觉定义为对给定行动方案的一种判断。这种判断是一种预感或关于正确性/合理性的信念,但这种判断没有明确的理由或依据,从本质上说,就是“知道是什么,却不知道为什么”。我们认为,这种“知道是什么,却不知道为什么”的直觉,实际上就是我们在第4章中提到的做出判断时产生的内部信号。

内部信号是一种自我管理的奖励,是一个人努力(有时或许没那么努力)做出判断并最终完成判断后的奖励。它是一种令人满意的情感体验,也是一种令人愉悦的一致感,它使我们感觉我们所考虑的证据和做出的判断是正确的,就如同玩拼图游戏时把所有的碎片都拼对了一样。稍后我们将看到,隐藏或忽略那些与判断不匹配的证据还可以增强这种一致感。

内部信号很重要,但具有误导性,因为内部信号往往会被理解为一种信念而不是感觉。这种“感觉正确”的情感经验伪装成了我们对判断有效性所持的信心——我知道该判断是正确的,即使我不知道为什么。

然而,对判断所持有的信心并不能保证判断的准确性,许多充满信心的预测都是错的。尽管偏差和噪声都会造成预测误差,但此类误差最重要的来源并非受限于预测性判断实际有多好,而是受限于预测性判断应该有多好。我们将这一局限性称为“客观无知”(objective ignorance),这也是本章的重点。

客观无知

如果你经常进行预测性判断,那么你可以问自己一个问题,这个问题可能适用于很多工作,如选择股票或预测职业运动员的表现。为了方便起见,我们使用在第9章中出现过的筛选应聘者的例子。假设近年来你已经评估了100名应聘者,现在,通过将自己的评估与应聘者入职后的实际表现进行对比,你就能够对自己的招聘决策的品质进行评估。如果你随机选出两名你评估过的应聘者,你认为你的事前判断和事后结果达成一致的可能性有多大?换句话说,比较任意两名应聘者,你认为更有潜力的应聘者实际上表现也更好的概率有多大?

我们经常就此问题对高管进行非正式调查,高管们的答案大部分为75%~85%。我们怀疑,他们可能由于谦虚或不想被认为是自吹自擂才做出了这样的回答,否则他们给出的比例会更高。研究人员在与高管们私下一对一的交谈中发现,高管们实际的自信程度往往更高。

既然你已经熟悉一致性比率(PC),那么你可以轻易地看出此类评估的问题。PC为80%大致对应的相关系数为0.8,在现实中人们的预测能力几乎无法达到这么高的水平。近期一篇有关人才选拔的报告指出,人类判断的预测相关系数远低于0.8,平均而言,人类判断的预测相关系数为0.28(PC=59%)。

鉴于人才选拔的难度很大,人类判断的表现糟糕也在情理之中。年轻人刚从事一份新工作时会面临许多机遇和挑战,这些机遇和挑战会以各种方式改变他的生活。他可能很幸运,遇到一位信任他、给他机会、在工作上提携他、帮他建立信心、能调动他的工作积极性的主管;他也可能没那么幸运,尽管自己没犯什么错,职业生涯却充满挫折。同样,他在私人生活中可能遇到的很多事也会影响他的工作表现,而这些事都是人们在当下无法预测的,就算是世界上最好的预测模型也无法预测,这种难以解决的不确定性包括所有与你的预测有关但当下无法得知的信息。

此外,与应聘者有关的很多事情从原则上说应该是可以知道的,但你在做判断时并不知道。对我们的目的而言,不管这种知识上的差距是源于缺少足够的预测性测试,还是由于获取更多信息的成本过高,抑或是由于你自己的调查疏忽,都无关紧要,不管是哪个原因,你都处于信息不完备的状态中。

难以琢磨的不确定性(未知之事)和不完备的信息(可知但不知之事)都将使完美预测变得不可能。这些未知信息并非源于判断中的偏差或噪声,而是源于任务本身的客观特征。这种由于重要信息缺失而产生的客观无知严重限制了人们判断的准确性,为避免用词太过专业,我们用“无知”来指代这种不确定性。这样可以避免混淆“不确定性”和“噪声”。不确定性是关于世界和未来的,噪声是本应相同的判断中出现的变异。

在某些情况下,我们能获得的信息比另外一些情况下更多,而且客观无知更少。此时,大多数专业判断的表现都是非常不错的。例如,医生可以对很多疾病做出准确的诊断,律师在面对法律纠纷时可以准确地判断法官的判决结果。

但是,一般而言,你仍然可以想象到,从事预测性工作的人还是会低估自身的客观无知。过度自信是已经被大量研究证明了的一种认知偏差。具体而言,人们往往会过度高估自己做出准确预测的能力,即使是在信息有限的条件下。我们所讲的预测性判断中的噪声也可以被称为客观无知,哪里有预测,哪里就有客观无知,而且客观无知比你想象的要严重得多。

异常自信的权威:准确性和黑猩猩扔飞镖差不多

心理学家菲利普·泰特洛克是我们的好朋友,他是一个坚持真理且充满幽默感的人。2005年,他出版了《专家的政治判断》(Expert Political Judgment)一书。书名听起来是中性的,但实际上这本书对专家预测政治事件的能力进行了猛烈抨击。

泰特洛克研究了近300位专家的预测,包括著名的记者、受人尊敬的学者以及国家领导人的高级智囊团等。他想验证这些人的政治、经济和社会性预测是否正确,这项研究持续了20年之久。可见,想要验证长期性预测是否正确,你必须有足够的耐心。

泰特洛克的主要发现是:这些所谓的专家在对重大政治事件进行预测时表现得非常糟糕。书中有句玩笑话很有名:“整体上,普通专家预测的准确性和黑猩猩扔飞镖差不多。”更精确地说,那本书的核心内容是:那些以“对政治和经济趋势发表评论或提供建议”谋生的专家,他们“在‘展望’新趋势时,做得并不比《纽约时报》的记者或细心的读者好”。可以肯定的是,专家们讲故事的能力很强,他们可以分析形势,并用令人信服的方式来描绘事态的发展趋势,并满怀信心地在演播室里反驳那些提出反对意见的人,但是他们真的知道会发生什么事吗?事实上,他们可能并不知道。

泰特洛克撕开了专家们的面具,并得出了上述结论。对于每个预测性问题,他都要求专家给出三种结果(维持现状、很可能发生或不大可能发生)的对应概率。在理想情况下,即使让一只黑猩猩通过扔飞镖的方式进行选择,它都会以相同的概率(1/3)“选中”三个结果中的任意一个。泰特洛克发现,专家们预测的准确率并不比这一最低标准好多少。平均而言,他们评估那些未来真正发生了的事件时,给出的概率只比那些最终没有发生的事件稍微高一点,但他们常常表现得异常自信。那些对世界该如何运转拥有一套清晰理论的权威人士是最自信的,也是最不可靠的。

泰特洛克的发现表明,对具体事件进行详细的、长期性的预测根本不可能。这个世界是混乱的,一些微不足道的小事都可能引发严重的后果。例如,在受孕的瞬间,历史上的每个重要人物以及无关紧要的人物都有50%的可能性会以另一种性别出生。那样一来,注定会发生不可预见的事件,而且这些不可预见的事件的后果也是不可预见的。因此,你对未来的展望越远,客观无知就积累得越多。专家们在政治判断上的局限性并非源于预测者的认知局限,而是由他们对未来的客观无知所决定的。因此,我们的结论是:不应该将专家失败的预测归咎于专家本人。但是,他们确实应该受到批评,因为他们在尝试完成一项不可能完成的任务,却相信自己可以做到。

泰特洛克还有一项令人震惊的发现:长期预测毫无用处。几年后,他与妻子芭芭拉·梅勒斯(Barbara Mellers)合作,研究了人们在相对较短的时间内(通常不到一年)对事件进行预测的情况。他们发现:短期预测是困难的,但并非不可能,而且有些人始终比大多数人(包括情报界的专业人士)预测得好。泰特洛克和梅勒斯将这些人称为“超级预测者”(superforecasters)。在我们看来,客观无知会随着我们对未来展望的深入而增多,他们的新发现恰恰与这一观点相符。我们将在第21章中继续讨论超级预测者。

人的判断很糟糕,但模型也不尽如人意

泰特洛克的早期研究表明,对于时间跨度较大的政治预测,人们往往是无能为力的。要想证明一项任务是不可能完成的,只有在很多可靠的参与者尝试了该任务并且都失败了的情况下才能做到,时间跨度较大的政治预测便是如此。我们已经给大家展示过,对信息进行机械性汇总的结果通常比人类的判断更优。由于在预测方面的准确性,规则和算法能够更好地验证某些结果能否真正被预测。

前面的章节可能会让你形成一种印象,即算法在进行预测性判断时具有压倒性的优势,但是你有这种印象可能是被误导了。模型确实比人表现得更好,但并没有好很多。没有证据表明,在依据相同的信息进行预测时,人类表现得非常差而模型却表现得非常好。

在第9章,我们提到有一篇报告对136项研究进行了回顾,这些研究表明机械性的整合优于诊断性判断。尽管这种优势的确是“大规模且一致的”,但两者的表现差距并不大。该报告中有93项研究关注的是二选一的决策问题,它们衡量了临床医生和公式的“命中率”。总体来说,临床医生有68%的预测是正确的,而公式有73%的预测是正确的。报告中另有35项研究用相关系数来衡量预测的准确性。这些研究发现,临床医生的判断与真实结果的平均相关系数为0.3(PC=60%),而公式预测的相关系数是0.56(PC=69%)。在这两个指标上,公式总是比临床医生预测得好,但是机械性预测的有效性依然有限,使用模型并不能改变相当低的预测性的上限。

人工智能的预测性如何呢?正如前文所述,人工智能通常要比简单模型表现得好,但在大多数情况下,它的表现远称不上完美。例如,请回想一下我们在第10章中讨论过的保释预测算法,我们发现,被拒绝保释的人数如果保持不变,该算法可以将犯罪率降低24%,相比于法官所做的预测,这是一个较大幅度的改进。但是,如果该算法可以准确地预测哪些被告会再次犯罪的话,它就能更大幅度地降低犯罪率。对未来将发生的犯罪行为进行预测是一种超自然的能力,它只存在于《少数派报告》(Minority Report)这种科幻小说中,因为对人类行为进行预测要面临大量的客观无知。

由塞德希尔·穆来纳森和齐亚德·欧博迈亚(Ziad Obermeyer)完成的另一项研究对心脏病诊断进行了建模。当患者有心脏病突发的迹象时,急诊医生必须决定是否需要进行额外的检查。原则上,仅当患者心脏病突发的风险足够高时才应进行额外的检查——这些检查不仅昂贵,而且有一定的风险性和侵害性。低风险患者无须进行额外的检查。因此,医生在决定是否开检查单时需要先评估患者心脏病突发的风险。研究者建立了一个人工智能模型来完成这一评估。该模型基于大样本数据(160万名患者的440万次医保就诊记录),并且使用了2400多个变量,有如此大的数据量,该模型应该可以突破客观无知的限制。

不出所料,该人工智能模型的准确性明显超过临床医生。若想进一步评估该模型的预测性能,请你想一下,如果对那些被模型判定为具有最高发病风险(前10%)的患者进行检查,并发现其中有30%的人确实会突发心脏病,而那些被模型判定为具有中等发病风险的患者中,只有9.3%的人突发了心脏病,我们就可以据此推论,医生的表现受限于客观无知的程度,至少与其受限于判断力不足的程度相差无几。

否认无知是无知的另一种诱导

完美预测是不可能实现的,这似乎是显而易见的事。当然,断言未来是不可预测的也算不上什么具有突破性的见解。然而,众多研究证据都表明,人们做预测时会过分自信,这说明很多时候这一显而易见的事实被我们忽视了。

过分自信的普遍性让我们对非正式调查中那些相信直觉的决策者有了新看法。我们发现,人们经常错误地将自信水平这一主观指标当成预测有效性的指标。例如,在第9章中,看完有关娜塔莉和莫妮卡的信息后,你做出了与信息相一致的判断,这时内部信号就会使你确信娜塔莉是更优的候选人。如果你对你的预测充满信心,你就已经陷入了效度错觉中:仅通过你所获取的信息进行预测,其准确性必然非常低。

那些对自己的判断极度自信的人否认自己的判断中存在噪声和偏差。他们不仅认为自己优于常人,甚至认为自己可以对一些实际上不可预测的事件进行预测。也就是说,他们从根本上否认现实的不确定性。用我们的术语来说,这种态度就是“否认无知”(denial of ignorance)。

梅尔及其追随者一直很困惑:为什么他们的研究结论未受到重视?为什么决策者总是依靠直觉来做决策?否认无知或许可以为此提供一个新的解释。当决策者聆听自己的直觉时,他们会听到内部信号,并感受到它带来的情感奖励。这种内部信号提示决策者已经做出了好的判断,它给了人们自信,让他们相信“知道是什么,却不知道为什么”的合理性。但是,对证据的真实预测效果进行的客观评估,很少能证明这样的自信是合理的。

放弃直觉确定性带来的情感奖励并非易事。因此,领导者们说,在高度不确定的情况下,他们更有可能依赖于直觉进行决策。如果现实无法给予他们把控感和信心,他们便会在直觉中寻求这些感觉。在充满无知的情况下,否认无知就显得更加诱人。

否认无知还解释了另一个谜团。面对我们之前给出的研究证据,许多高管给出了一个矛盾的结论。他们辩解道,尽管基于直觉的决策并不完美,但是,如果系统性的替代方案依然不完美,那么这样的方案就不值得采用。例如,人类判断的预测得分与员工绩效之间的平均相关系数为0.28(PC=59%),相应地,机械性预测可能做得更好,但并没有好很多,其预测的相关系数为0.44(PC=65%)。那么高管们可能会问,为什么我们还要采用机械性预测呢?

答案是,在诸如人事选拔这类重要的决策上,这种预测有效性的提高是很有意义的。某些高管会不断地在工作中做出重大改变,但得到的回报并不多。理性地讲,他们明白没有100%的成功,因此会努力做好各种决策以提高成功的可能性。他们也明白概率的含义:如果能够以相同的价格购买有65%中奖概率的彩票,没有人会去购买只有59%中奖概率的彩票。

问题在于,在很多情况下两者的“收益”是不一样的,直觉判断往往伴随着奖励,即内部信号。当算法能够获得更高的准确性时,人们会更愿意相信算法,因为它的确定性带来的“收益”可以与内部信号相匹敌,甚至超越它。然而,如果替代方案是某种不一定会产生更高的预测准确性的机械性过程,人们就不愿意放弃内部信号带来的情感奖励了。

这一发现对于提高决策的品质具有重要意义。尽管所有证据都表明,机械性的预测方法和算法确实可以在一定程度上提高预测的准确性,但很多决策者仍会拒绝采用这些不让他们依据直觉进行决策的方法。只要算法还不够完美,人类的判断就不会被取代。而且在许多领域中,客观无知决定了算法不可能达到完美。这就是必须对人类判断进行改进的原因所在。