bangst

学习进度

阅读时长

未满 1 分钟

最近阅读：未开始阅读

核心概念

待提炼

章节学习

1
献词
献给诺加、奥里和吉利 ——丹尼尔·卡尼曼献给范丁和莱莉亚 ——奥利维耶·西博尼献给萨曼莎 ——卡斯·R.桑斯坦
待学习
开始阅读
2
重磅赞誉
从“偏差”到“噪声”，作为心理学家的卡尼曼，挑战的是经济学的“理性人”假设，并因开启了行为经济学的大门而获得诺贝尔经济学奖。他一直关注的是人类在决策中是如何犯错的，在这本书中，他深入分析了噪声的影响，但也乐观地预期，可以通过发掘埋没在大数据中的信息来减少决策中的噪声，这可以说是大数据渗透到行为经济学领域的新趋势。巴曙松北京大学汇丰金融研究院执行院长，中国
待学习
开始阅读
3
测一测如何做一个聪明的决策者？
测一测如何做一个聪明的决策者？想知道你的判断是怎么掉入噪声陷阱的吗？扫码测一测，立即获取答案及解析，看看你的“降噪等级”。 1．卡尼曼是世界上第一个凭借心理学研究获得诺贝尔经济学奖的人。这个说法对吗？ A．对 B．不对 2．卡尼曼指出：人类判断出错的原因有两种。一种是偏差，另一种是什么呢？ A．误差 B．噪声 C．系统认知 3．在做一个判断时，以
待学习
开始阅读
4
推荐序1 在无法回避噪声的世界，更好地追求高级境界与极致效益
推荐序1 Preface 在无法回避噪声的世界，更好地追求高级境界与极致效益彭凯平清华大学社会科学学院院长每年七八月份，我都会参加清华大学的本科生招生工作，由此而目睹了一个问题：高考揭榜之后，高中毕业生及其家长应如何做好志愿填报？学校和专业的选择非常重要，很有可能会决定一个学生一辈子的命运，其中牵涉的问题就与我们心理学中一个重要的研究领域紧密相关，那
待学习
开始阅读
5
推荐序2 穿越噪声的决策
推荐序2 Preface 穿越噪声的决策朱宁上海交通大学上海高级金融学院金融学教授，副院长我抱着浓厚的兴趣读完了诺贝尔经济学奖得主丹尼尔·卡尼曼教授等的新作《噪声》一书，这本书汇集了卡尼曼教授近十年的最新发现。对于我所从事的行为金融学研究领域而言，《噪声》算得上是一本“专业书”，但是读完之后，我认为它很可能是卡尼曼教授继《思考，快与慢》后，又一次成功将
待学习
开始阅读
6
中文版序哪里有判断，哪里就有噪声
中文版序 Preface 哪里有判断，哪里就有噪声我们非常荣幸，也非常感激，能够在中国出版这本书。《噪声》重点关注人类的判断，关注它是如何出错的，以及如何让它变得更好。无论是医学、法律、公共政策、商业，还是日常生活领域中，我们做出判断的过程中存在的问题，是偏好根据经验做判断的人类的共性问题。数十年来，偏差问题备受瞩目。在《思考，快与慢》一书中，本书的作者
待学习
开始阅读
7
引言偏差与噪声，人类判断的两类错误
引言 Introduction 偏差与噪声，人类判断的两类错误试想一下，你的朋友组成了A、B、C、D共4支队伍，来到一个射击场。每队中有5个人，他们共用一支来复枪，且每人只开了一枪。图0-1显示了他们的射击结果。图0-1 4支队伍的射击结果理想情况是，每一枪都能正中靶心。 A队几乎达到了理想情况，他们的每一发子弹都紧紧围绕着靶心，接近完美模式。 B队的
待学习
开始阅读
8
第1章犯罪和充满噪声的判罚
第1章犯罪和充满噪声的判罚假设某人被指控犯了罪，例如到商店行窃、私藏海洛因、袭击他人或持枪抢劫，该案件可能的判决结果是什么？答案不应取决于该案件恰巧被指派给哪位法官、天气是冷是热，以及当地球队在前一天是输是赢。如果3个背景类似的人被指控犯有同一罪行，最后却得到截然不同的处罚，例如第一个人被判缓刑，第二个人被判2年有期徒刑，最后一个人被判10年有期徒刑，
待学习
开始阅读
9
第2章系统噪声，给人达成一致的错觉
第2章系统噪声，给人达成一致的错觉我们最初接触噪声，并对这个主题产生兴趣，并不是因为遇到了像刑事司法案件那般富有戏剧性的案例。实际上，这次邂逅纯属偶然，缘于一家保险公司，这家公司与我们中的两人所属的咨询公司有合作。我们的研究揭示了营利性组织中存在噪声问题的严重性——组织会因为决策中的噪声损失惨重。我们在保险公司的经历有助于解释为什么噪声问题常常被忽视，以
待学习
开始阅读
10
第3章单一决策，仅发生一次的重复决策
第3章单一决策，仅发生一次的重复决策到目前为止，我们所讨论的案例研究都与重复决策相关。比如，对盗窃犯的恰当判决是什么？对某一特定风险该收取多少保费？虽然每个具体的案例在某种意义上都是独特的，但像这样的判断属于重复决策。医生诊断患者，法官审理假释案件，招生人员审查入学申请书，会计师准备税单等，这些都是重复决策。正如前一章所介绍的，重复决策中的噪声可以通过
待学习
开始阅读
11
第4章什么是判断
第4章什么是判断本书论述的是一般意义上的专业判断，我们假设如果做判断的人有足够的能力，就能做出准确的判断。然而，判断这一概念本身包含着一个你不得不承认的事实：你永远无法确定一个判断是不是准确。请思考“判断问题”和“主观判断”这两个短语的差别。我们认为“太阳明天会升起”或“NaCl是氯化钠的化学式”这样的陈述并非判断，因为任何理性的人都会完全同意上述观点
待学习
开始阅读
12
第5章测量误差，噪声与偏差的代价一样大
第5章测量误差，噪声与偏差的代价一样大显而易见的是，一致性的偏差会引发代价高昂的错误。如果体重秤在你每次称体重时都自动加上一定的重量，如果一位乐观的经理总是预测项目只需花费实际所需时间的一半，如果一位谨小慎微的经理总是年复一年地低估未来的销售额，那么后果都将会非常严重。我们已经知道，噪声会引发代价高昂的错误。如果一位经理大多数时候预测的项目所需时间只是
待学习
开始阅读
13
第6章噪声分析：所有判断都存在3类噪声
第6章噪声分析：所有判断都存在3类噪声在上一章，我们讨论了单个案例中测量或判断的变异性。在单个案例中，判断的所有变异性都是误差，而误差由偏差和噪声组成。我们考察的判断系统，包括法院和保险公司的判断系统，它们的目的在于处理不同案例，并对这些案例进行区分。如果美国的联邦法官和保险理赔员对他们手头的所有案例都做出相同的判断，那他们就没有什么存在的价值了。对不同
待学习
开始阅读
14
第7章情境噪声，无时无刻不在影响着我们的判断
第7章情境噪声，无时无刻不在影响着我们的判断想象一名职业篮球运动员正在准备罚球的场景：他站在罚球线上，全神贯注地准备投篮。这是他练习过无数次的一系列动作，他能投中吗？我们无法预知结果。在NBA的比赛中，球员们通常能够4罚3中。显然，一些球员比其他球员表现得更好，但没有人能做到百发百中(3)。虽然篮筐一直都是距离地面3.05米，与罚球线的垂直距离一直是4
待学习
开始阅读
15
第8章群体是如何放大噪声的
第8章群体是如何放大噪声的个体判断中存在噪声的结果已经很糟糕了，但群体决策中的噪声危害更甚。群体决策可能会由于一些无关因素而朝任何一个方向改变。谁先发言、谁后发言，谁说话更自信，谁穿着黑色衣服，谁和谁挨着坐，谁在某个时刻笑了／皱眉了／呈现出其他身体姿势……所有这些因素都会影响结果。相似的群体每一天都会做出各种不同的决策，如雇用、晋升、破产、沟通策略、环境
待学习
开始阅读
16
第9章判断与模型，简单的模型普遍优于人类判断
第9章判断与模型，简单的模型普遍优于人类判断很多人都对预测未来的工作绩效感兴趣，不只是自己的，还有别人的。因此，绩效预测是用来考察预测性判断的实用例子。例如，一家大公司在招聘高管时，聘请了一家专业咨询公司对两名候选人莫妮卡和娜塔莉进行评估，并以取值为1～10分的量表对两人的领导力、沟通能力、人际交往能力、职业技能、应聘动机等维度进行打分（见表9-1）。你
待学习
开始阅读
17
第10章无噪声的规则
第10章无噪声的规则近年来，人工智能（Artificial Intelligence）特别是机器学习技术让机器能够执行许多以前只有人类才能执行的任务。机器学习算法可以承担人脸识别、语言翻译、分析医学影像等任务，并且可以以惊人的速度和准确性来处理计算问题，例如为成千上万名驾驶员迅速规划行车路线。它们还可以执行困难的预测任务：预测美国最高法院的判决；识别哪些
待学习
开始阅读
18
第11章哪里有预测，哪里就有客观无知
第11章哪里有预测，哪里就有客观无知我们经常同一些公司高管分享第9章和第10章中的研究内容，并通过发人深省的发现让他们意识到人类的判断是有限的。这些发现已经存在了半个多世纪，应该很少有人能避开它们，但人们仍然对这些发现很抵触。在我们的听众里，有一些高管会很自豪地告诉我们，相比于定量分析，他们更相信自己的直觉；其他人虽然没明说，但他们也有同样的看法。有关
待学习
开始阅读
19
第12章常态谷：事情虽无法预测，但可以被理解
第12章常态谷：事情虽无法预测，但可以被理解现在我们来考虑一个更大的问题：在这个世界上，有些问题容易解决，有些问题却充满了客观无知，那我们应如何自处呢？毕竟，在存在很严重的客观无知的情况下，我们很快就能意识到，用水晶球来预测未来是徒劳的，但我们通常并不会对这个世界产生这种体验。相反，正如上一章所提到的，我们一直在基于少量的有用信息来对未来做出大胆预测。在
待学习
开始阅读
20
第13章启发式、偏差与噪声
第13章启发式、偏差与噪声本书是对横跨半个世纪的关于人类直觉判断研究的延续，也就是所谓的“启发式和偏差研究项目”（heuristics and biases program）。《思考，快与慢》一书对该研究项目前40年的研究内容进行了回顾，探讨了能够解释“直觉思维的奇妙与缺陷”的心理机制。该项目的核心思想是，当回答一个难题时，人们会使用简化的思维操作系统—
待学习
开始阅读
21
第14章匹配，找到与你的预测最精准匹配的共识
第14章匹配，找到与你的预测最精准匹配的共识现在请看向天空，你认为两小时内下雨的可能性有多大？你可能很容易就答出了这个问题。你做出判断时毫不费力。你可能在不知不觉中就把对天空黑暗程度的评估转换成了概率判断。你刚刚做的事就是一种典型的“匹配”（matching）。我们将判断描述为一种思维操作，该思维操作会为主观印象或印象的某个方面在量表上找到对应的值。匹
待学习
开始阅读
22
第15章选取精确的量表，并多用相对判断
第15章选取精确的量表，并多用相对判断假设你是民事审判案件中的一名陪审员。你目前所掌握的证据大致如下，你要据此做出判断。琼·格洛弗（Joan Glover）诉General Assistance公司案一个名叫琼·格洛弗的6岁小女孩吞下了大量非处方抗过敏药AllerFree，需要住院治疗很长时间。大剂量的药物使她的呼吸系统变得很脆弱，因此她很容易患上哮
待学习
开始阅读
23
第16章模式噪声的构成
第16章模式噪声的构成还记得朱莉吗？我们在第14章中提到的那个早慧的孩子。你曾尝试预测她的大学GPA。以下是有关朱莉的详细介绍。朱莉是独生女。她的父亲是一位事业有成的律师，母亲是一位建筑师。朱莉大约3岁时，她的父亲患上了一种自体免疫性疾病，不得不居家办公。他花大量的时间陪伴朱莉，并耐心地教她读书识字。朱莉4岁时就能流畅地阅读。她的父亲也曾尝试教她算术，
待学习
开始阅读
24
第17章噪声源，偏差是引人注目的图形，而噪声是不受我们关注的背景
第17章噪声源，偏差是引人注目的图形，而噪声是不受我们关注的背景哪里有判断，哪里就有噪声，希望你现在也认同这一观点。我们也希望，对你而言这已不再是一件超乎想象的事。这也正是我们着手开展研究的主要动力。经过多年的努力，我们对这个问题的思考已经逐渐深入和完善。现在，来回顾一下我们已经了解的噪声成分、这些成分对噪声的重要影响以及它们在判断中所起的作用。噪声成
待学习
开始阅读
25
第18章卓越的判断者，卓越的判断力
第18章卓越的判断者，卓越的判断力至目前为止，我们主要谈论的是人类的判断，而没有对不同的判断者进行区分。显然，在任何一项任务中，有些人做出的判断要优于其他人。即使是由群体做出的判断，如果该群体由高能力个体组成，那么最终的判断也会更优。这就引出了一个重要的问题，即如何甄别出更好的判断者。有三件事至关重要。如果做判断的人受过良好的训练、更睿智且拥有正确的认
待学习
开始阅读
26
第19章消除偏差与决策卫生
第19章消除偏差与决策卫生许多研究人员和机构都力图减少判断偏差。在本章中，我们将分析他们的核心发现。我们将介绍消除偏差的各类干预措施之间的区别，并探讨其中一种值得进一步研究的干预措施。随后，我们将讨论如何减少噪声，并介绍决策卫生的概念。干预：事后及事前消除偏差减少偏差有两种主要方式，要描述它们的特点，一个好方法是回到测量类比。假设你家浴室里的体重秤在
待学习
开始阅读
27
第20章司法科学，信息排序是最大的噪声
第20章司法科学，信息排序是最大的噪声 2004年3月，在西班牙首都马德里，一组被放置在通勤列车上的炸弹爆炸，造成192人死亡，2000多人受伤。人们在犯罪现场的塑料袋上发现了一枚指纹，并通过国际刑警组织将其传送到了世界各地的执法机构。几天后，美国联邦调查局（FBI）犯罪实验室最终确认这枚指纹属于一个居住在俄勒冈州的美国公民布兰登·梅菲尔德（Brandon
待学习
开始阅读
28
第21章甄选与汇总，超级预测的两大策略
第21章甄选与汇总，超级预测的两大策略许多判断都涉及预测，比如，下个季度的失业率可能是多少？明年将售出多少辆电动汽车？2050年的气候变化会带来什么影响？盖完一幢新楼需要多长时间？某家公司的年收入是多少？新员工会有什么样的表现？新的空气污染管理制度的成本是多少？谁将赢得选举？这些问题的答案会产生重大影响，因为私人机构和公共机构的一些重要选择往往取决于这些
待学习
开始阅读
29
第22章医疗决策，用科学的诊断指南减少噪声
第22章医疗决策，用科学的诊断指南减少噪声几年前，我们的一位好朋友保罗被他的主治医师琼斯诊断为患有高血压。琼斯医生建议保罗尝试药物治疗，他给保罗开了利尿剂，但保罗的血压依旧很高，也就是说药物没起到效果。几个星期后，琼斯又开了第二种药物——钙通道阻滞剂，但效果依然不理想。这些结果使琼斯困惑不已。虽然过去的3个月保罗每星期都会来复诊，但他的血压只是略有下降
待学习
开始阅读
30
第23章绩效评估，用基于外部视角的共识框架做出量化判断
第23章绩效评估，用基于外部视角的共识框架做出量化判断让我们从一个练习开始：请选出3个你认识的人，他们可以是你的朋友或同事。请在友善、智慧和勤奋这3种特质上给他们进行1～5分的评分，其中1分是最低分，5分是最高分。现在再请另一个很了解他们的人（这个人可以是你的配偶、好友或者最亲密的同事）用同样的方式对这3个人进行评分。在某些评估中，你和其他评分者很可能
待学习
开始阅读
31
第24章人员招聘，以结构化指标衡量人才
第24章人员招聘，以结构化指标衡量人才如果你曾经找过工作，那么“招聘面试”这个词可能会唤起你的一些生动而紧张的回忆。工作面试，即求职者与未来的主管或人力专员会面，是进入许多组织的必经之路。在大多数情况下，面试遵循着既定的流程。在寒暄之后，面试官会要求应聘者描述他们的个人经历，或者详细地描述他们经历过的某些特定情形。再问一些诸如个人成就与挑战、工作动机以
待学习
开始阅读
32
第25章中介评估法，做出明智决策的核心方法
第25章中介评估法，做出明智决策的核心方法不久前，我们两个人（卡尼曼和西博尼）与我们的朋友丹·罗瓦洛（Dan Lovallo）一起，介绍过组织中使用的一种决策方法。这一方法的首要目的在于减少噪声，我们称之为中介评估法。该方法涵盖了我们前几章所介绍的大多数决策卫生策略，并且它的应用范围很广泛，只要在计划或选项的评估过程中需要考虑和权衡多维度信息，我们就可以
待学习
开始阅读
33
第26章减少噪声的成本
第26章减少噪声的成本每当我们建议人们消除噪声时，他们可能会以成本过高为由进行反对，并认为在极端情况下，减少噪声根本不可能。我们已经在商业、教育、政府以及其他领域听到过这种反对意见，这种观点虽然有一定的合理性，但言过其实了，或者只不过是一个借口。为了证明我们的这种反对意见更有说服力，举一个高中老师为文章评分的例子。有位高中老师每星期都要对学生撰写的25
待学习
开始阅读
34
第27章尊严，人之为人的重要价值观
第27章尊严，人之为人的重要价值观设想如下三个场景：你申请房产抵押，但被拒绝，其原因并非有人实际考察了你的情况，而是因为银行有严格的规定，认为你这种信用等级的人不能申请房产抵押；你的条件很出色，而且一家公司的面试官也觉得你很不错，但你的求职申请被拒绝了，原因是15年前你曾被判刑，而该公司明令禁止录用任何有犯罪前科的人；你被判有罪，但不能被保释，这并非由于
待学习
开始阅读
35
第28章规则还是标准
第28章规则还是标准如果我们的目标是减少噪声和了解如何减少噪声（或在多大程度上减少噪声），那么我们就有必要区分两种约束行为的方式：规则和标准。很多组织通常会选择其中的一种，或将两者结合起来使用。在商业领域，某家公司可能会有以下要求：员工必须在指定的时间内工作；每个人的休假时间不能超过两个星期；如果有人将公司的秘密泄露给媒体，那么他就会被解雇。我们也可以
待学习
开始阅读
36
回顾与总结正视噪声问题
回顾与总结正视噪声问题噪声是我们在做判断时不希望存在的变异，然而噪声实在太多了，本书的核心目标就在于解释为何会如此，以及我们应该如何应对噪声。本书涵盖的内容十分丰富，我们在这里仅从一个宽泛的视角来对书中的核心观点进行简要的回顾和总结。判断不是计算，也无须遵循精确的规则需要注意的是，不要把本书中的“判断”一词与“思考”一词混淆。判断是一个相对狭义的概念
待学习
开始阅读
37
结语一个噪声很少的世界
结语一个噪声很少的世界请想象一下，经过重新设计并减少了噪声的组织会是什么样子。医院、招聘委员会、经济预测机构、政府机构、保险公司、公共卫生机构、刑事司法系统、律师事务所和大学，都会对噪声问题保持警觉，并努力减少这些问题。噪声审查将会成为惯例，或许每年都能进行一次。未来，组织的领导者将会在更多领域中使用算法来代替人类判断，或将其作为人类判断的补充。人们会
待学习
开始阅读
38
附录1 如何进行噪声审查
附录1 如何进行噪声审查附录1是一份关于如何进行噪声审查的实用指南。你可以以企业顾问的视角来阅读这部分内容，设想一下这家企业雇用你来对它的一个部门员工的专业决策进行噪声审查。顾名思义，噪声审查的重点当然在于考察噪声的普遍性，然而，良好的噪声审查其实也能提供关于员工培训和工作监管中存在的偏差、盲点和缺陷的有价值信息。成功的审查有利于促进部门改革，包括改进专
待学习
开始阅读
39
附录2 决策观察者检查清单
附录2 决策观察者检查清单本附录给出了一份决策观察者（见第19章）检查清单的通用示例。这里提供的清单大致遵循做重要决策的时间顺序。清单中每一项之后的参考问题都对相应的项目做了进一步说明。决策观察者在审视决策过程时应该问自己这些问题。决策观察者不应照搬照抄这个清单。我们希望它发挥的作用是为决策观察者提供灵感和基准，并使决策观察者能够据此设计出适合自己的偏
待学习
开始阅读
40
附录3 对抗噪声，修正预测
附录3 对抗噪声，修正预测匹配性预测是我们依赖直觉式匹配过程而产生的错误（参见第14章）。当我们基于现有信息做预测时，我们会进行匹配性预测，就好像我们能够依据这些信息对结果做出完美的或准确率非常高的预测一样。让我们来回顾一下朱莉的例子，她4岁就能流利地阅读，那么她在大学时的GPA会是多少呢？如果你预测朱莉在大学时的GPA是3.8，这就意味着你从直觉上判断
待学习
开始阅读
41
致谢
我们要感谢很多人。林内亚·甘地（Linnea Gandhi）是我们的参谋长，她为我们提供了大量的指导和帮助，使我们的工作可以有条不紊地推进，让我们的工作充满欢声笑语。基本可以说，是她主持了本书的撰写。除此之外，她还为本书的初稿提出了许多宝贵建议，没有她，我们无法顺利完成本书。丹·罗瓦洛对成书也起到了非常重要的作用，本书的观点最初就源于他与人合著的一篇文章。我
待学习
开始阅读
42
译者后记
汪祚军中国科学院心理研究所博士，宁波大学教授感谢编辑部独具慧眼，能够邀请中国科学院心理研究所李纾研究员领衔本书的翻译工作。李纾老师是国内最早从事行为决策研究的专家，在行为决策领域深耕数十年，其提出的“齐当别”决策模型在心理学界具有重要的影响力。作为行为决策领域的一名研究者、李纾老师曾经的博士生，能够参与本书的翻译工作，我深感荣幸。在拿到本书的英文原书后
待学习
开始阅读
43
注释
引言偏差与噪声，人类判断的两类错误射击场只是一种隐喻：1778年，瑞士数学家丹尼尔·伯努利（Daniel Bernoulli）在一篇关于评估问题的论文中使用弓和箭进行了相同的类比。Bernoulli, “The Most Probable Choice Between Several Discrepant Observations and the For
待学习
开始阅读

Reader

章节阅读

Local EPUB Text

第18章卓越的判断者，卓越的判断力

至目前为止，我们主要谈论的是人类的判断，而没有对不同的判断者进行区分。显然，在任何一项任务中，有些人做出的判断要优于其他人。即使是由群体做出的判断，如果该群体由高能力个体组成，那么最终的判断也会更优。这就引出了一个重要的问题，即如何甄别出更好的判断者。

有三件事至关重要。如果做判断的人受过良好的训练、更睿智且拥有正确的认知风格，那么他的判断也会产生更少的噪声和偏差。换言之，好的判断取决于你的经验、思维能力，以及你的思考方式。好的判断者往往经验丰富且充满智慧，但他们也时刻保持着思维的开放性，愿意接纳新的信息。

专家和尊重型专家

毋庸赘言，判断者的技能影响其判断品质。例如，资深的放射科医生更有可能对肺炎做出准确的诊断；一些“超级预言家”对世界大事的预测，大大超越其他不那么厉害的同行；如果你召集一些在某个法律领域真正专业的律师，他们可能会对常见法律纠纷的判决结果做出大体一致的、准确的预测。专业水平高的人做出的判断，噪声更少，偏差也更少。

这些人是某个领域的真正专家。他们能做出比其他人更好的判断，这一点是可验证的，因为有结果的数据可以证明。至少在原则上，我们可以根据医生、预言家、律师以往判断的准确率来进行选择。出于显而易见的原因，这一方法在现实生活中可能遇到困难。我们并不建议你要求你的家庭医生进行专业度测试。

我们已经指出，有一些判断的效果是无法验证的。在一定范围内，我们不能轻易得知或毫无争议地确定一些判断的真正价值，保险核保、刑事判决当属此类。此外，品酒、文章评分、书评和影评，以及其他数不胜数的判断也属此类。虽然这些领域的一些专业人士也被称为专家，但我们对这些专家所做判断的信心建立在同行对他的尊重的基础上。我们将这类专家称为“尊重型专家”（respect-expert）。

尊重型专家这一称谓本身并无冒犯之意，事实上，指出这些专家的判断的价值无法被准确评估这一点也并非一种批评，因为在很多领域中，情况本就如此。很多教授、学者和管理顾问也是尊重型专家。他们的可信度取决于学生、同行或客户对他们的尊重程度。在这些领域乃至其他更多领域中，某位专家的判断只能与他们同行的判断进行比较。

在缺少衡量对错的客观标准时，我们常常会看重尊重型专家的意见，虽然这些专家彼此之间也可能意见不一致。不妨想象这样一个画面：一群政治分析家对外交危机的起因以及可能的发展趋势有着截然不同的看法（这种不一致并非个别现象，如果他们全体意见一致才是怪事）。所有政治分析家都相信有一个正确的观点，而他们自己的观点是最接近正确的那一个。如果你仔细听，你会发现，几位分析家的观点都让人印象深刻，他们的论据也同样具有说服力，你现在不知道他们谁对谁错。如果他们的分析没有通过确定、可证实的预测来明确表达，那你以后也可能不会知道。你知道，至少有些分析家是错的，毕竟他们意见不一致，但你仍然尊重他们的专业性。

再来看一组根本不需要做出任何预测的专家。三位受过良好训练的道德哲学家齐聚一堂，其中一位是康德的追随者，第二位支持杰里米·边沁，第三位信奉亚里士多德。关于道德的要求，他们之间分歧很大。他们争论的内容包括撒谎是否合理、何时撒谎是合理的、动物的权益以及惩罚犯罪的目的。你认真聆听，可能会佩服他们的思维清晰、严谨，也可能倾向于认同他们中的一位，但你对他们所有人都很尊重。

为什么会这样？说得更明确一些，为什么那些因自身判断的高质量而受到他人尊重的人，在没有任何客观证据证明专家专业性的情况下，会选择信任某些专家呢？是什么造就了尊重型专家？

一部分原因是他们遵循共同的准则或专业规范。专家往往需要从专门的组织获得专业认证，并在对应的机构中接受训练，受这些机构监管。完成住院实习的医生和向资深伙伴学习的年轻律师，不仅要学习使用各自行业的技术工具，也要接受特定方法的培训，以及遵守特定的规范。

有了共同的准则，专业人士就能知道在判断时应该考虑哪些因素、如何做出判断，以及如何确保最终的判断更加合理。例如，在保险公司，理赔员很容易就理赔金额达成一致，并阐述充分的理由，因为这些要考虑的因素已经包含在了理赔评估检查清单中。

当然，这种一致性并不能消除理赔员在理赔评估中存在的广泛差异，因为规范并没有对所有细节做出十分明确具体的规定，让理赔员照搬照做。事实上，规则留有解释的空间。专家仍然需要做出判断，而不是执行计算过程，这就是为什么噪声不可避免。即使受过相同训练的专业人士认可共同的准则，他们在实际应用该准则时，彼此之间也存在差异。

除了掌握共同的准则，专家还要具备丰富的经验。如果你的特长是下围棋、演奏钢琴，或是投掷标枪，那么你有可能成为天才少年，因为结果验证了你的水平。然而，核保员、指纹鉴定人员、法官则需要多年的经验才能获得认可，在核保行业，天才少年根本不存在。

尊重型专家的另一个特征是，他们能够满怀信心地做出判断并解释自己的判断。相比于那些自我怀疑的人，我们更加信任那些满怀自信的人。自信启发式（confidence heuristic）指出，在群体中，自信者具有更高的影响力，即使他们的自信毫无理由。尊重型专家善于构建能自圆其说的理论，他们能够凭借经验识别事件的模式，与之前的案例进行类比推理，迅速形成并验证假设。他们很容易将所见的事实整合成一个连贯的故事，这种能力令他们信心十足。

智商高的人判断力更好

训练、经验以及自信是尊重型专家获得信任的决定性因素，但具备这些因素并不能确保他们做出的判断就是高品质的。那么，我们怎样才能知道哪些专家能做出更好的判断呢？

我们有充足的理由相信，智力水平与更好的判断相关。智力与几乎所有领域的良好表现都相关。在所有其他条件等同的情况下，智力不仅与更好的学业成就有关，也与更好的工作绩效相关。

对于如何测量智力或一般心智能力（General Mental Ability，GMA）(9)，争议和误解一直存在。人们对智力的本质也一直存在误解。事实上，这些测试测量的是发展能力，这些能力一部分由遗传决定，一部分受环境（包括教育机会）影响。许多人也担心根据GMA测试做出的筛选会对一些社会群体产生不利影响，并质疑将GMA测试用于筛选是否合理。

我们需要将对这种测试的担忧及其实际的预测品质区分看待。自从一个世纪以前美国陆军采用心智能力测试以来，成千上万的研究考察了人们的认知测试分数与其随后表现之间的关系。通过大量研究，人们得出了非常清晰一致的结论。就像一篇评论文章所指出的那样：“GMA预测的是个体在其所选职业中能达到的专业水平及其表现。它在这两个方面的预测能力比预测任何其他能力、个性特征、性格特点的能力都要强，并且比根据工作经验进行预测更为准确。”当然，其他认知能力也很重要（本章稍后将详细讨论）。一些个性特征也很重要，其中包括责任心和毅力——在追求长期目标时的意志和热情。当然，GMA未能将多种不同形式的智力纳入测量范畴，例如实践智力与创造力。心理学家和神经科学家还把智力分为晶体智力（crystallized intelligence）和流体智力（fluid intelligence），前者是指个体根据自身所掌握的关于世界的知识（包括数学运算）解决问题的能力，后者是指个体解决新问题的能力。

标准化的GMA测试测量个体在语言、计量和空间等方面的能力，尽管它还比较粗糙并存在一定的局限，但它仍然是迄今为止重要结果的最佳单个预测指标。正如那篇评论文章所指出的，GMA的预测效力比心理学研究中的大部分测量方法都好。随着工作内容复杂程度的增加，GMA与工作成就之间的相关性也会增加，这非常合乎逻辑——相比于从事简单工作的人，智力对火箭专家来说显然更为重要。对于高度复杂的工作，标准化测验分数与工作绩效之间的相关系数可以达到0.5（PC=67%）。我们在前面已经指出，按照社会科学的标准，相关系数达到0.5代表非常强的预测力。

在讨论高度专业性的判断时，人们经常会提到一个反对智力测量相关性的重要理由：所有做出这些判断的人很可能都拥有高GMA。相比于普通大众，医生、法官以及高级核保员通常都受过更好的教育，因而他们的认知能力测试得分往往会高出普通人很多。据此，你可能有理由相信，高GMA在他们之间并没有产生什么差别，它只是进入高成就群体的“入场券”，而不能解释这个群体中个体成就的差异。

这种观点虽然被普遍接受，但并不正确。毫无疑问，对于某一特定职业，相比于处于顶层的人群，底层人群的GMA分布范围更广：从事社会地位较低的职业的群体中有高GMA的个体，但在律师、化学家或工程师这些职业中，几乎没有GMA低于平均水平的人。从这个角度来看，高GMA是从事社会地位较高的职业的必要条件。

然而，这个测量指标并不能解释这些群体中的个体在成就上的差异。即使是认知能力的评测成绩位于前1%的群体（评测时的年龄为13岁），他们能获得的突出成就也与GMA高度相关。在这前1%的群体中，那些处于前1/4的人获得博士学位、出版著作、获得专利的可能性比那些处于后1/4的人高出2～3倍。换言之，GMA差异的重要性，不仅存在于第99百分位数和第80或第50百分位数之间，甚至在第99.88百分位数和第99.13百分位数之间仍然存在！

2013年的一项研究重点调查了《财富》500强企业的CEO和424位美国亿万富翁（财富排名前0.0001%的美国人），结果惊人地证明了能力与成就之间的关联。这项研究发现，这些超级精英群体是由智商最高的一群人组成的，这与预期一致。这项研究还发现，在这一群体内部，更高的受教育水平和能力水平，与更高的薪酬（对CEO而言）和净资产（对亿万富翁而言）相关。虽然偶有个例，比如史蒂夫·乔布斯、比尔·盖茨和马克·扎克伯格等是从著名大学辍学后成为亿万富翁的，但他们是“遮挡了森林的树木”——仅有约1/3的美国成年人获得了大学学位，但美国亿万富翁获得大学学位的比例高达88%。

结论显而易见。在需要做出判断的职业中，GMA会显著影响判断的品质，即使是在一群高能力的个体之中，情况亦是如此。有人认为存在一个界限，达到这个界限之后，GMA就不再起作用，但这种观点没有得到上述证据的支持。这一结论反而强有力地表明，如果专业判断是无法验证的且只能假定它更接近一个看不见的靶心，那么高能力个体的判断更有可能接近目标。如果你必须挑选一些人来做判断，那么你的最优选择是挑选那些高智商的人。

这一系列推理有一个严重的局限。由于你不能对每一个人进行标准化测试，你就需要去猜测哪些人属于高GMA人群。高GMA能显而易见地提高诸多方面的表现，包括有能力让别人相信你说的是对的。具有高心智能力的人，比其他人更能做出好的判断，也更有可能成为真正的专家；他们也同样能给同行留下深刻印象，获得后者的信任，在缺少现实反馈的情况下成为尊重型专家。这样看来，中世纪的占星家就有可能是那个时代的高GMA人群。

信任那些举止言谈给人睿智之感或是能为他们自己的判断做出令人信服的解释的人，这种策略有一定的合理性，但并不完全理性，甚至可能适得其反。那么，是否有其他方法可以甄别出真正的专家呢？能够做出更好判断的人是否还具有其他明显的特征呢？

认知风格对判断的影响

不管心智能力如何，人们的认知风格或执行判断任务的方法都是不同的。研究人员已经研发了一些表现认知风格的工具。大部分测量方法都与GMA相关（或者彼此相关），但测量的重点各不相同。

其中一种测量是“认知反射测试”（Cognitive Reflection Test，CRT），该测试就是大众熟知的“球和球棒”问题：一个球和一个球棒的价格为1.1美元，球棒比球贵1美元，那么这个球值多少钱？研究人员建议使用的其他测量问题包括：在一场跑步比赛中，你超过了第二名，你现在是第几名？CRT旨在测量人们能够在多大程度上抑制闯进大脑中的第一个答案，也就是错误的答案：在球和球棒问题中回答“0.1美元”，在跑步比赛问题中回答“第一名”。低CRT得分与现实生活中的一些判断和信念有关，比如相信鬼魂、占星术、超感知觉（俗称“第六感”）。CRT得分还可以预测人们是否会因为明显不准确的“假信息”而上当。该测试的得分甚至与人们使用智能手机的程度有关。

许多人将CRT视为测量一种更宽泛的概念的工具，即测量人们是否会习惯性地运用反射性或冲动性思维过程。简言之，有些人喜欢深入思考，而另一些人在面对同样的问题时往往会相信自己一时兴起做出的判断。用我们的专业术语来说就是，CRT是一种测量人们倾向于使用缓慢的系统2思维还是快速的系统1思维的方法。

其他自我评估的方法也被用来测量这一倾向，当然，所有这些测试都是彼此相关的。例如，认知需求量尺考察人们愿意在多大程度上仔细思考问题。要想在这项测试中得高分，你必须认同“我倾向于设定一些我要付出大量脑力劳动才能实现的目标”而不能认同“思考不是我的乐趣”。认知需求高的人不太容易出现已知的认知偏差。研究者还提及了一些匪夷所思的联系：“如果你不喜欢‘剧透’，你可能具有更高的认知需求；那些在认知需求量表上得分低的人，更偏爱‘剧透’。”

这是一个自我评估的量表，并且什么样的答案更容易得到大众认可是显而易见的，因而会引发相当合理的质疑。那些希望给他人留下良好印象的人不太可能会认同“思考不是我的乐趣”这样的表述。因此，其他测验试图直接测量人们的技能，而不再采用自我描述的方式。

其中一个例子是“成人决策能力量表”（adult decision making competence scale）。这一量表测量人们在判断过程中犯一些典型错误的倾向性，比如风险知觉中的过度自信或不一致性。另一个例子是“哈尔彭批判性思维测试”（Halpern critical thinking assessment），这一工具主要评估批判性思维技能，包括理性思考的倾向和一套可习得的技能。在评估中，你需要回答类似下面的问题：想象一下，你的一位朋友不知道应该选择两个减肥项目中的哪一个，于是向你征求意见。其中一个项目称他们的客户平均减掉约11千克；另一个项目称他们的客户平均减掉约13.6千克。在进行选择之前，你认为需要先弄清楚哪些问题？如果你回答说，你想知道“有多少人减掉了这么多重量”“减肥效果能否维持一年以上”等问题，你就会因应用了批判性思维而获得相应的分数。在成人决策能力量表或哈尔彭批判性思维测试中，获得高分的人们在生活中似乎能做出更好的判断：他们较少承担由错误判断导致的不良后果，例如意外怀孕，或因忘记归还租来的影碟而不得不支付滞纳金。

认知风格和能力的测量以及其他测量都能对判断品质进行预测，这种看法似乎是合理的。然而，认知风格和能力与判断品质之间的相关性随任务的不同而产生差异。乌里尔·哈兰（Uriel Haran）、伊拉娜·里托夫（Ilana Ritov）和芭芭拉·梅勒斯在寻找可以作为人的预测能力指标的认知风格时发现，认知需求并不能预测谁会更努力地去获取信息。他们也并未发现认知需求与更高的绩效之间存在稳定的关系。

唯一能预测人们的预测品质的量表是由心理学教授乔纳森·伯龙（Jonathan Baron）发明的。该量表用于测量人们的“积极开放性思维”（actively open-minded thinking）。积极开放性思维是指个体愿意积极搜寻与自己先前的假设相矛盾的信息，这些信息包括其他人的不同意见以及与原有看法不一致的新证据。具有积极开放性思维的人会认同“允许自己被相反的意见说服是一种良好的品质”这类陈述，而不认同“改变想法是一种脆弱的表现”或“直觉是决策的最佳指南”这类观点。

换言之，虽然认知反射和认知需求的得分情况反映的是人们进行慢思考或审慎思考的倾向，但积极开放性思维更胜一筹。那些谦逊的人会一直提醒自己判断是一个不断发展的过程，并渴望被纠正。我们在第21章会看到，拥有这种思维模式的人是最好的预测者，他们会根据新的信息不断修正自己的思维和观念。好消息是，一些证据表明，开放性思维是一种可习得的技能。

这里，我们不打算就如何在某些领域挑选出能做出良好判断的人给出一个硬性的结论，但从上面这个简短的描述中可以得出两个通用原则。首先，比较明智的做法是，认识到不同领域专家之间的区别：在一些领域，例如天气预报领域，专家的预测是可以被客观验证的，因此其专业水平可以分出优劣；而另一些领域的专家则是尊重型专家，比如政治分析家可能说得头头是道，令人信服，而象棋大师可能看起来谦卑内敛，也无法解释走出某些棋步的理由，然而，相比于后一种情况，你更需要对前一种专家的判断持怀疑态度。

其次，一些判断者有可能比其他具有同等资历和经验的人做得更好。如果有些人表现得更好，那么他们的判断将会出现更少的偏差或噪声。在导致这种差异的诸多因素中，智商和认知风格是关键。尽管没有哪一项单独的测试或量表能够准确无误地预测人们的判断品质，但你可以试着去物色这样的人：他们愿意积极搜寻与自己的看法不一致的信息，并把这种信息整合进当前观点，且希望最终能改变自己的想法。

具有卓越判断能力的人，他们的个性可能不符合公众认可的行事果断的领导者形象。人们往往倾向于相信和喜欢这样的领导者：他们自信满满、口齿伶俐，似乎轻而易举或生来就知道什么是对的，而且这类领导者还能激发人们的信心。但证据表明，如果想要减少错误的判断，那么对于领导者或普通人而言，最好的做法是对反对意见持开放态度，并乐于接受“自己可能错了”的想法，如果依然想要坚持己见，那也是在听取了各方意见之后，而不是之前。

阅读时长

核心概念

章节学习

第18章 卓越的判断者，卓越的判断力

第18章卓越的判断者，卓越的判断力