bangst

学习进度

阅读时长

未满 1 分钟

最近阅读：未开始阅读

核心概念

待提炼

章节学习

1
献词
献给诺加、奥里和吉利 ——丹尼尔·卡尼曼献给范丁和莱莉亚 ——奥利维耶·西博尼献给萨曼莎 ——卡斯·R.桑斯坦
待学习
开始阅读
2
重磅赞誉
从“偏差”到“噪声”，作为心理学家的卡尼曼，挑战的是经济学的“理性人”假设，并因开启了行为经济学的大门而获得诺贝尔经济学奖。他一直关注的是人类在决策中是如何犯错的，在这本书中，他深入分析了噪声的影响，但也乐观地预期，可以通过发掘埋没在大数据中的信息来减少决策中的噪声，这可以说是大数据渗透到行为经济学领域的新趋势。巴曙松北京大学汇丰金融研究院执行院长，中国
待学习
开始阅读
3
测一测如何做一个聪明的决策者？
测一测如何做一个聪明的决策者？想知道你的判断是怎么掉入噪声陷阱的吗？扫码测一测，立即获取答案及解析，看看你的“降噪等级”。 1．卡尼曼是世界上第一个凭借心理学研究获得诺贝尔经济学奖的人。这个说法对吗？ A．对 B．不对 2．卡尼曼指出：人类判断出错的原因有两种。一种是偏差，另一种是什么呢？ A．误差 B．噪声 C．系统认知 3．在做一个判断时，以
待学习
开始阅读
4
推荐序1 在无法回避噪声的世界，更好地追求高级境界与极致效益
推荐序1 Preface 在无法回避噪声的世界，更好地追求高级境界与极致效益彭凯平清华大学社会科学学院院长每年七八月份，我都会参加清华大学的本科生招生工作，由此而目睹了一个问题：高考揭榜之后，高中毕业生及其家长应如何做好志愿填报？学校和专业的选择非常重要，很有可能会决定一个学生一辈子的命运，其中牵涉的问题就与我们心理学中一个重要的研究领域紧密相关，那
待学习
开始阅读
5
推荐序2 穿越噪声的决策
推荐序2 Preface 穿越噪声的决策朱宁上海交通大学上海高级金融学院金融学教授，副院长我抱着浓厚的兴趣读完了诺贝尔经济学奖得主丹尼尔·卡尼曼教授等的新作《噪声》一书，这本书汇集了卡尼曼教授近十年的最新发现。对于我所从事的行为金融学研究领域而言，《噪声》算得上是一本“专业书”，但是读完之后，我认为它很可能是卡尼曼教授继《思考，快与慢》后，又一次成功将
待学习
开始阅读
6
中文版序哪里有判断，哪里就有噪声
中文版序 Preface 哪里有判断，哪里就有噪声我们非常荣幸，也非常感激，能够在中国出版这本书。《噪声》重点关注人类的判断，关注它是如何出错的，以及如何让它变得更好。无论是医学、法律、公共政策、商业，还是日常生活领域中，我们做出判断的过程中存在的问题，是偏好根据经验做判断的人类的共性问题。数十年来，偏差问题备受瞩目。在《思考，快与慢》一书中，本书的作者
待学习
开始阅读
7
引言偏差与噪声，人类判断的两类错误
引言 Introduction 偏差与噪声，人类判断的两类错误试想一下，你的朋友组成了A、B、C、D共4支队伍，来到一个射击场。每队中有5个人，他们共用一支来复枪，且每人只开了一枪。图0-1显示了他们的射击结果。图0-1 4支队伍的射击结果理想情况是，每一枪都能正中靶心。 A队几乎达到了理想情况，他们的每一发子弹都紧紧围绕着靶心，接近完美模式。 B队的
待学习
开始阅读
8
第1章犯罪和充满噪声的判罚
第1章犯罪和充满噪声的判罚假设某人被指控犯了罪，例如到商店行窃、私藏海洛因、袭击他人或持枪抢劫，该案件可能的判决结果是什么？答案不应取决于该案件恰巧被指派给哪位法官、天气是冷是热，以及当地球队在前一天是输是赢。如果3个背景类似的人被指控犯有同一罪行，最后却得到截然不同的处罚，例如第一个人被判缓刑，第二个人被判2年有期徒刑，最后一个人被判10年有期徒刑，
待学习
开始阅读
9
第2章系统噪声，给人达成一致的错觉
第2章系统噪声，给人达成一致的错觉我们最初接触噪声，并对这个主题产生兴趣，并不是因为遇到了像刑事司法案件那般富有戏剧性的案例。实际上，这次邂逅纯属偶然，缘于一家保险公司，这家公司与我们中的两人所属的咨询公司有合作。我们的研究揭示了营利性组织中存在噪声问题的严重性——组织会因为决策中的噪声损失惨重。我们在保险公司的经历有助于解释为什么噪声问题常常被忽视，以
待学习
开始阅读
10
第3章单一决策，仅发生一次的重复决策
第3章单一决策，仅发生一次的重复决策到目前为止，我们所讨论的案例研究都与重复决策相关。比如，对盗窃犯的恰当判决是什么？对某一特定风险该收取多少保费？虽然每个具体的案例在某种意义上都是独特的，但像这样的判断属于重复决策。医生诊断患者，法官审理假释案件，招生人员审查入学申请书，会计师准备税单等，这些都是重复决策。正如前一章所介绍的，重复决策中的噪声可以通过
待学习
开始阅读
11
第4章什么是判断
第4章什么是判断本书论述的是一般意义上的专业判断，我们假设如果做判断的人有足够的能力，就能做出准确的判断。然而，判断这一概念本身包含着一个你不得不承认的事实：你永远无法确定一个判断是不是准确。请思考“判断问题”和“主观判断”这两个短语的差别。我们认为“太阳明天会升起”或“NaCl是氯化钠的化学式”这样的陈述并非判断，因为任何理性的人都会完全同意上述观点
待学习
开始阅读
12
第5章测量误差，噪声与偏差的代价一样大
第5章测量误差，噪声与偏差的代价一样大显而易见的是，一致性的偏差会引发代价高昂的错误。如果体重秤在你每次称体重时都自动加上一定的重量，如果一位乐观的经理总是预测项目只需花费实际所需时间的一半，如果一位谨小慎微的经理总是年复一年地低估未来的销售额，那么后果都将会非常严重。我们已经知道，噪声会引发代价高昂的错误。如果一位经理大多数时候预测的项目所需时间只是
待学习
开始阅读
13
第6章噪声分析：所有判断都存在3类噪声
第6章噪声分析：所有判断都存在3类噪声在上一章，我们讨论了单个案例中测量或判断的变异性。在单个案例中，判断的所有变异性都是误差，而误差由偏差和噪声组成。我们考察的判断系统，包括法院和保险公司的判断系统，它们的目的在于处理不同案例，并对这些案例进行区分。如果美国的联邦法官和保险理赔员对他们手头的所有案例都做出相同的判断，那他们就没有什么存在的价值了。对不同
待学习
开始阅读
14
第7章情境噪声，无时无刻不在影响着我们的判断
第7章情境噪声，无时无刻不在影响着我们的判断想象一名职业篮球运动员正在准备罚球的场景：他站在罚球线上，全神贯注地准备投篮。这是他练习过无数次的一系列动作，他能投中吗？我们无法预知结果。在NBA的比赛中，球员们通常能够4罚3中。显然，一些球员比其他球员表现得更好，但没有人能做到百发百中(3)。虽然篮筐一直都是距离地面3.05米，与罚球线的垂直距离一直是4
待学习
开始阅读
15
第8章群体是如何放大噪声的
第8章群体是如何放大噪声的个体判断中存在噪声的结果已经很糟糕了，但群体决策中的噪声危害更甚。群体决策可能会由于一些无关因素而朝任何一个方向改变。谁先发言、谁后发言，谁说话更自信，谁穿着黑色衣服，谁和谁挨着坐，谁在某个时刻笑了／皱眉了／呈现出其他身体姿势……所有这些因素都会影响结果。相似的群体每一天都会做出各种不同的决策，如雇用、晋升、破产、沟通策略、环境
待学习
开始阅读
16
第9章判断与模型，简单的模型普遍优于人类判断
第9章判断与模型，简单的模型普遍优于人类判断很多人都对预测未来的工作绩效感兴趣，不只是自己的，还有别人的。因此，绩效预测是用来考察预测性判断的实用例子。例如，一家大公司在招聘高管时，聘请了一家专业咨询公司对两名候选人莫妮卡和娜塔莉进行评估，并以取值为1～10分的量表对两人的领导力、沟通能力、人际交往能力、职业技能、应聘动机等维度进行打分（见表9-1）。你
待学习
开始阅读
17
第10章无噪声的规则
第10章无噪声的规则近年来，人工智能（Artificial Intelligence）特别是机器学习技术让机器能够执行许多以前只有人类才能执行的任务。机器学习算法可以承担人脸识别、语言翻译、分析医学影像等任务，并且可以以惊人的速度和准确性来处理计算问题，例如为成千上万名驾驶员迅速规划行车路线。它们还可以执行困难的预测任务：预测美国最高法院的判决；识别哪些
待学习
开始阅读
18
第11章哪里有预测，哪里就有客观无知
第11章哪里有预测，哪里就有客观无知我们经常同一些公司高管分享第9章和第10章中的研究内容，并通过发人深省的发现让他们意识到人类的判断是有限的。这些发现已经存在了半个多世纪，应该很少有人能避开它们，但人们仍然对这些发现很抵触。在我们的听众里，有一些高管会很自豪地告诉我们，相比于定量分析，他们更相信自己的直觉；其他人虽然没明说，但他们也有同样的看法。有关
待学习
开始阅读
19
第12章常态谷：事情虽无法预测，但可以被理解
第12章常态谷：事情虽无法预测，但可以被理解现在我们来考虑一个更大的问题：在这个世界上，有些问题容易解决，有些问题却充满了客观无知，那我们应如何自处呢？毕竟，在存在很严重的客观无知的情况下，我们很快就能意识到，用水晶球来预测未来是徒劳的，但我们通常并不会对这个世界产生这种体验。相反，正如上一章所提到的，我们一直在基于少量的有用信息来对未来做出大胆预测。在
待学习
开始阅读
20
第13章启发式、偏差与噪声
第13章启发式、偏差与噪声本书是对横跨半个世纪的关于人类直觉判断研究的延续，也就是所谓的“启发式和偏差研究项目”（heuristics and biases program）。《思考，快与慢》一书对该研究项目前40年的研究内容进行了回顾，探讨了能够解释“直觉思维的奇妙与缺陷”的心理机制。该项目的核心思想是，当回答一个难题时，人们会使用简化的思维操作系统—
待学习
开始阅读
21
第14章匹配，找到与你的预测最精准匹配的共识
第14章匹配，找到与你的预测最精准匹配的共识现在请看向天空，你认为两小时内下雨的可能性有多大？你可能很容易就答出了这个问题。你做出判断时毫不费力。你可能在不知不觉中就把对天空黑暗程度的评估转换成了概率判断。你刚刚做的事就是一种典型的“匹配”（matching）。我们将判断描述为一种思维操作，该思维操作会为主观印象或印象的某个方面在量表上找到对应的值。匹
待学习
开始阅读
22
第15章选取精确的量表，并多用相对判断
第15章选取精确的量表，并多用相对判断假设你是民事审判案件中的一名陪审员。你目前所掌握的证据大致如下，你要据此做出判断。琼·格洛弗（Joan Glover）诉General Assistance公司案一个名叫琼·格洛弗的6岁小女孩吞下了大量非处方抗过敏药AllerFree，需要住院治疗很长时间。大剂量的药物使她的呼吸系统变得很脆弱，因此她很容易患上哮
待学习
开始阅读
23
第16章模式噪声的构成
第16章模式噪声的构成还记得朱莉吗？我们在第14章中提到的那个早慧的孩子。你曾尝试预测她的大学GPA。以下是有关朱莉的详细介绍。朱莉是独生女。她的父亲是一位事业有成的律师，母亲是一位建筑师。朱莉大约3岁时，她的父亲患上了一种自体免疫性疾病，不得不居家办公。他花大量的时间陪伴朱莉，并耐心地教她读书识字。朱莉4岁时就能流畅地阅读。她的父亲也曾尝试教她算术，
待学习
开始阅读
24
第17章噪声源，偏差是引人注目的图形，而噪声是不受我们关注的背景
第17章噪声源，偏差是引人注目的图形，而噪声是不受我们关注的背景哪里有判断，哪里就有噪声，希望你现在也认同这一观点。我们也希望，对你而言这已不再是一件超乎想象的事。这也正是我们着手开展研究的主要动力。经过多年的努力，我们对这个问题的思考已经逐渐深入和完善。现在，来回顾一下我们已经了解的噪声成分、这些成分对噪声的重要影响以及它们在判断中所起的作用。噪声成
待学习
开始阅读
25
第18章卓越的判断者，卓越的判断力
第18章卓越的判断者，卓越的判断力至目前为止，我们主要谈论的是人类的判断，而没有对不同的判断者进行区分。显然，在任何一项任务中，有些人做出的判断要优于其他人。即使是由群体做出的判断，如果该群体由高能力个体组成，那么最终的判断也会更优。这就引出了一个重要的问题，即如何甄别出更好的判断者。有三件事至关重要。如果做判断的人受过良好的训练、更睿智且拥有正确的认
待学习
开始阅读
26
第19章消除偏差与决策卫生
第19章消除偏差与决策卫生许多研究人员和机构都力图减少判断偏差。在本章中，我们将分析他们的核心发现。我们将介绍消除偏差的各类干预措施之间的区别，并探讨其中一种值得进一步研究的干预措施。随后，我们将讨论如何减少噪声，并介绍决策卫生的概念。干预：事后及事前消除偏差减少偏差有两种主要方式，要描述它们的特点，一个好方法是回到测量类比。假设你家浴室里的体重秤在
待学习
开始阅读
27
第20章司法科学，信息排序是最大的噪声
第20章司法科学，信息排序是最大的噪声 2004年3月，在西班牙首都马德里，一组被放置在通勤列车上的炸弹爆炸，造成192人死亡，2000多人受伤。人们在犯罪现场的塑料袋上发现了一枚指纹，并通过国际刑警组织将其传送到了世界各地的执法机构。几天后，美国联邦调查局（FBI）犯罪实验室最终确认这枚指纹属于一个居住在俄勒冈州的美国公民布兰登·梅菲尔德（Brandon
待学习
开始阅读
28
第21章甄选与汇总，超级预测的两大策略
第21章甄选与汇总，超级预测的两大策略许多判断都涉及预测，比如，下个季度的失业率可能是多少？明年将售出多少辆电动汽车？2050年的气候变化会带来什么影响？盖完一幢新楼需要多长时间？某家公司的年收入是多少？新员工会有什么样的表现？新的空气污染管理制度的成本是多少？谁将赢得选举？这些问题的答案会产生重大影响，因为私人机构和公共机构的一些重要选择往往取决于这些
待学习
开始阅读
29
第22章医疗决策，用科学的诊断指南减少噪声
第22章医疗决策，用科学的诊断指南减少噪声几年前，我们的一位好朋友保罗被他的主治医师琼斯诊断为患有高血压。琼斯医生建议保罗尝试药物治疗，他给保罗开了利尿剂，但保罗的血压依旧很高，也就是说药物没起到效果。几个星期后，琼斯又开了第二种药物——钙通道阻滞剂，但效果依然不理想。这些结果使琼斯困惑不已。虽然过去的3个月保罗每星期都会来复诊，但他的血压只是略有下降
待学习
开始阅读
30
第23章绩效评估，用基于外部视角的共识框架做出量化判断
第23章绩效评估，用基于外部视角的共识框架做出量化判断让我们从一个练习开始：请选出3个你认识的人，他们可以是你的朋友或同事。请在友善、智慧和勤奋这3种特质上给他们进行1～5分的评分，其中1分是最低分，5分是最高分。现在再请另一个很了解他们的人（这个人可以是你的配偶、好友或者最亲密的同事）用同样的方式对这3个人进行评分。在某些评估中，你和其他评分者很可能
待学习
开始阅读
31
第24章人员招聘，以结构化指标衡量人才
第24章人员招聘，以结构化指标衡量人才如果你曾经找过工作，那么“招聘面试”这个词可能会唤起你的一些生动而紧张的回忆。工作面试，即求职者与未来的主管或人力专员会面，是进入许多组织的必经之路。在大多数情况下，面试遵循着既定的流程。在寒暄之后，面试官会要求应聘者描述他们的个人经历，或者详细地描述他们经历过的某些特定情形。再问一些诸如个人成就与挑战、工作动机以
待学习
开始阅读
32
第25章中介评估法，做出明智决策的核心方法
第25章中介评估法，做出明智决策的核心方法不久前，我们两个人（卡尼曼和西博尼）与我们的朋友丹·罗瓦洛（Dan Lovallo）一起，介绍过组织中使用的一种决策方法。这一方法的首要目的在于减少噪声，我们称之为中介评估法。该方法涵盖了我们前几章所介绍的大多数决策卫生策略，并且它的应用范围很广泛，只要在计划或选项的评估过程中需要考虑和权衡多维度信息，我们就可以
待学习
开始阅读
33
第26章减少噪声的成本
第26章减少噪声的成本每当我们建议人们消除噪声时，他们可能会以成本过高为由进行反对，并认为在极端情况下，减少噪声根本不可能。我们已经在商业、教育、政府以及其他领域听到过这种反对意见，这种观点虽然有一定的合理性，但言过其实了，或者只不过是一个借口。为了证明我们的这种反对意见更有说服力，举一个高中老师为文章评分的例子。有位高中老师每星期都要对学生撰写的25
待学习
开始阅读
34
第27章尊严，人之为人的重要价值观
第27章尊严，人之为人的重要价值观设想如下三个场景：你申请房产抵押，但被拒绝，其原因并非有人实际考察了你的情况，而是因为银行有严格的规定，认为你这种信用等级的人不能申请房产抵押；你的条件很出色，而且一家公司的面试官也觉得你很不错，但你的求职申请被拒绝了，原因是15年前你曾被判刑，而该公司明令禁止录用任何有犯罪前科的人；你被判有罪，但不能被保释，这并非由于
待学习
开始阅读
35
第28章规则还是标准
第28章规则还是标准如果我们的目标是减少噪声和了解如何减少噪声（或在多大程度上减少噪声），那么我们就有必要区分两种约束行为的方式：规则和标准。很多组织通常会选择其中的一种，或将两者结合起来使用。在商业领域，某家公司可能会有以下要求：员工必须在指定的时间内工作；每个人的休假时间不能超过两个星期；如果有人将公司的秘密泄露给媒体，那么他就会被解雇。我们也可以
待学习
开始阅读
36
回顾与总结正视噪声问题
回顾与总结正视噪声问题噪声是我们在做判断时不希望存在的变异，然而噪声实在太多了，本书的核心目标就在于解释为何会如此，以及我们应该如何应对噪声。本书涵盖的内容十分丰富，我们在这里仅从一个宽泛的视角来对书中的核心观点进行简要的回顾和总结。判断不是计算，也无须遵循精确的规则需要注意的是，不要把本书中的“判断”一词与“思考”一词混淆。判断是一个相对狭义的概念
待学习
开始阅读
37
结语一个噪声很少的世界
结语一个噪声很少的世界请想象一下，经过重新设计并减少了噪声的组织会是什么样子。医院、招聘委员会、经济预测机构、政府机构、保险公司、公共卫生机构、刑事司法系统、律师事务所和大学，都会对噪声问题保持警觉，并努力减少这些问题。噪声审查将会成为惯例，或许每年都能进行一次。未来，组织的领导者将会在更多领域中使用算法来代替人类判断，或将其作为人类判断的补充。人们会
待学习
开始阅读
38
附录1 如何进行噪声审查
附录1 如何进行噪声审查附录1是一份关于如何进行噪声审查的实用指南。你可以以企业顾问的视角来阅读这部分内容，设想一下这家企业雇用你来对它的一个部门员工的专业决策进行噪声审查。顾名思义，噪声审查的重点当然在于考察噪声的普遍性，然而，良好的噪声审查其实也能提供关于员工培训和工作监管中存在的偏差、盲点和缺陷的有价值信息。成功的审查有利于促进部门改革，包括改进专
待学习
开始阅读
39
附录2 决策观察者检查清单
附录2 决策观察者检查清单本附录给出了一份决策观察者（见第19章）检查清单的通用示例。这里提供的清单大致遵循做重要决策的时间顺序。清单中每一项之后的参考问题都对相应的项目做了进一步说明。决策观察者在审视决策过程时应该问自己这些问题。决策观察者不应照搬照抄这个清单。我们希望它发挥的作用是为决策观察者提供灵感和基准，并使决策观察者能够据此设计出适合自己的偏
待学习
开始阅读
40
附录3 对抗噪声，修正预测
附录3 对抗噪声，修正预测匹配性预测是我们依赖直觉式匹配过程而产生的错误（参见第14章）。当我们基于现有信息做预测时，我们会进行匹配性预测，就好像我们能够依据这些信息对结果做出完美的或准确率非常高的预测一样。让我们来回顾一下朱莉的例子，她4岁就能流利地阅读，那么她在大学时的GPA会是多少呢？如果你预测朱莉在大学时的GPA是3.8，这就意味着你从直觉上判断
待学习
开始阅读
41
致谢
我们要感谢很多人。林内亚·甘地（Linnea Gandhi）是我们的参谋长，她为我们提供了大量的指导和帮助，使我们的工作可以有条不紊地推进，让我们的工作充满欢声笑语。基本可以说，是她主持了本书的撰写。除此之外，她还为本书的初稿提出了许多宝贵建议，没有她，我们无法顺利完成本书。丹·罗瓦洛对成书也起到了非常重要的作用，本书的观点最初就源于他与人合著的一篇文章。我
待学习
开始阅读
42
译者后记
汪祚军中国科学院心理研究所博士，宁波大学教授感谢编辑部独具慧眼，能够邀请中国科学院心理研究所李纾研究员领衔本书的翻译工作。李纾老师是国内最早从事行为决策研究的专家，在行为决策领域深耕数十年，其提出的“齐当别”决策模型在心理学界具有重要的影响力。作为行为决策领域的一名研究者、李纾老师曾经的博士生，能够参与本书的翻译工作，我深感荣幸。在拿到本书的英文原书后
待学习
开始阅读
43
注释
引言偏差与噪声，人类判断的两类错误射击场只是一种隐喻：1778年，瑞士数学家丹尼尔·伯努利（Daniel Bernoulli）在一篇关于评估问题的论文中使用弓和箭进行了相同的类比。Bernoulli, “The Most Probable Choice Between Several Discrepant Observations and the For
待学习
开始阅读

Reader

章节阅读

Local EPUB Text

第6章噪声分析：所有判断都存在3类噪声

在上一章，我们讨论了单个案例中测量或判断的变异性。在单个案例中，判断的所有变异性都是误差，而误差由偏差和噪声组成。我们考察的判断系统，包括法院和保险公司的判断系统，它们的目的在于处理不同案例，并对这些案例进行区分。如果美国的联邦法官和保险理赔员对他们手头的所有案例都做出相同的判断，那他们就没有什么存在的价值了。对不同案例做出有差异的判断，在很大程度上是有意为之。

然而，人们并不希望在同一案例上存在判断的差异——系统噪声。你将看到，对同一批人在多个案例上做出的判断进行噪声审查，有利于更详细地分析系统噪声。

判决中的噪声审查

为了说明多起案件的噪声分析结果，我们对美国联邦法官的判决进行了非常详细的噪声审查。这一分析发表于1981年，也是我们在第1章介绍过的量刑改革运动的一部分。这一研究局限于判决，但我们能从中获得的经验是通用的，也适用于其他专业判断。进行噪声审查的目的不是检查弗兰克尔法官等人收集的逸闻趣事中的噪声，而是更系统地“确定量刑差异的程度”。

研究人员设计了16起虚构案件。在这些案件中，被告都犯下了罪行，即将接受审判。这些案件主要是关于抢劫犯或诈骗犯的，但他们在其他6个维度上存在差异，如被告是主犯还是从犯、是否有犯罪记录、是否使用武器（对抢劫犯而言）等。研究人员精心组织了面向美国全国范围内208名现任法官的结构性访谈。在90分钟的访谈中，研究人员向这些法官呈现16起案件的详细文件，并要求法官们做出判决。

图表可能更有助于我们对研究的理解。请想象有一张大表格，表格中有16列，对应从A到P的16起案件；有208行，对应208名法官。从A1到P208的每一个单元格对应一位法官对每起案件的量刑。图6-1展示了这3328个单元格的表格样貌。为了研究噪声，我们需要将注意力集中在这16列上，其中每一列对应一个独立的噪声审查。

图6-1　判决研究示例

平均刑期，每一起案件的判决都存在大量噪声

由于没有办法客观地确定某一起案件量刑的“真实值”，所以接下来，我们将208名法官对每起案件判定刑期的均值作为对该案件的“公正”判决。正如我们在第1章中指出的，美国量刑委员会在将以往审判中的平均值作为制定量刑指南的基础时，也以同样的假设为前提。刑期均值假定，对每起案件对应的刑期取平均值，那么这起案件中的偏差为0。

我们很清楚，这一假设在现实生活中是错误的：一些案件对应的平均刑期与其他高度相似的案件的平均刑期相比，可能存在较大偏差，比如也许是种族歧视等因素所致。不同案件中存在的偏差也不尽相同，有些是正偏差，有些是负偏差，它们是造成误差和不公平的主要成因。令人困惑的是，这种差异经常被称为“偏差”。本章以及本书分析的焦点都是噪声，它是误差的另一个成因。弗兰克尔法官强调了噪声导致的不公正，同时也引起了人们对偏差（包括种族歧视）的关注。同样，我们强调噪声的影响，并不代表我们认为测量和消除偏差不重要。

为了方便起见，我们在表格的最后一行给出每起案件对应的刑期均值。这些案件按照严重程度从低到高排列：案件A对应的平均刑期为1年；案件P对应的平均刑期为15.3年。所有16起案件对应的平均刑期为7年。

想象在一个完美的世界中，所有法官都是完美无瑕的司法公正的代言人，他们的量刑中不存在任何噪声。那么在这样一个世界中，图6-1看起来会是怎样的呢？显然，对于案件A来说，所有单元格中的刑期应该完全相同，因为每位法官都会判处被告1年刑期。其他案件的情况也是如此。当然，每一行中的数字仍然存在差异，毕竟案件不同，但每一列中的数字应该是相同的。不同案件对应的刑期之间的差异应该是导致该表格中出现变异性的唯一因素。

可惜，美国联邦法院并不存在于完美的世界中。法官们的量刑并不相同，每一列的数字之间的差异巨大，这意味着每一起案件的判决中都存在噪声。量刑中存在不应该存在的巨大变异性，而该研究的目的就在于对这种变异性进行分析。

判刑就像抽签

假设我们确实生活在上述完美世界中，每位法官对每起案件都会做出相同的判决，那么每列中的208个数字都应该相同。现在，为每一列从上到下增加噪声，并通过不时地在平均刑期上增加或减少刑期来改变一些数字。因为你的修改并不总是相同的，它们在每一列中都制造了变异。这种变异就是噪声。

本项研究的重要发现是，每起案件的判决中都存在大量噪声。我们可以通过计算每起案件对应刑期的标准差来测量噪声。这些案件对应的平均刑期为7年，标准差为3.4年。

或许你对标准差非常熟悉，但采用具体的描述或许更有助于理解。假设你随机选择两位法官，并计算他们在对同一案件的判决中存在的差异。重复这个过程，计算所有案件中任意两位法官的判决差异，取平均值。这种测量方法——计算平均绝对离差，会让你觉得被告就是在法庭上“抽签”。假想这些判决呈正态分布，平均绝对离差就是标准差的1.128倍，这表明，两位随机选择的法官对同一案件量刑的平均绝对离差为3.8年。在第3章中我们谈到，保险公司的客户在寻找专业核保员时，就像在抽签。只不过在刑事判决中，被告所面临的类似抽签的状况，其后果更加严重。

在平均刑期为7年的情况下，不同法官之间的平均绝对离差达到3.8年，这令人不安，也是难以接受的。然而，我们有充足的理由相信，现实的执法中甚至存在更严重的噪声。首先，噪声审查中的被试处理的是虚构的案件，这些案件同时放在一起，很容易比较。现实世界中几乎不可能具备如此多的保持判断一致性的因素。其次，在法庭上，法官拥有的信息要比这项研究的信息多得多。除非新的信息是决定性的信息，否则它们更有可能导致法官们的分歧。因此我们认为，在实际的庭审中，被告面临的噪声要比我们在这里看到的多得多。

水平噪声

在接下来的分析中，我们会将噪声分解成不同成分。对于噪声，你脑海中的第一个念头可能是，噪声是由法官们在量刑时的严厉程度不一所致，就像弗兰克尔法官认为的那样。正如一些辩护律师告诉你的：法官们各有特点。有的人是“铁面判官”，他们比一般法官更严厉；有的人是“柔情法官”，他们比一般法官更仁慈。我们将这些差异称为“水平误差”（level errors）。（再次提醒：这里的误差是指判决结果与平均值之间的差异；如果判决结果的平均值是错的，一个误差可能反倒纠正了这种不公正。）

任何判断都会存在不同程度的水平误差。例如，在进行绩效评估时，一些主管比其他人更宽容；在预测市场份额时，一些预测者比其他人更乐观；在是否需要实施背部手术时，一些骨科医生比其他医生的态度更积极。

在图6-1的表格中，每一行显示的是同一位法官对不同案件的判决结果。每一位法官判定的平均刑期展示在表的最右侧一列，这一列的数据反映了每一位法官的严厉程度。正如该表格所示，在这一维度上，法官之间的差异很大。表格最右侧这一列数字的标准差为2.4年。这种差异与公正无关。事实上，正如你所怀疑的那样，每位法官在平均刑期上的差异反映了不同法官在其他特征上的差异，例如他们的背景、生活阅历、政治倾向、偏见等。研究人员还考察了每位法官对于量刑的根本态度，比如，法官认为量刑定罪的主要目的究竟是让罪犯无法再危害社会（与社会隔离），还是对罪犯进行改造，抑或是对犯罪起威慑作用。研究人员发现，与持后两种观点的法官相比，持第一种观点的法官判处的刑期更短，监视居住的时间要长。此外，美国南部的法官比美国其他地区的法官判定的刑期明显要长。这说明，刑罚的严厉程度与保守的意识形态有关。

研究人员从中得出的一般性结论是，量刑的平均水平就像人格特征。你可以根据这项研究结果，将法官按“非常严厉”到“非常宽容”进行排序，就像用人格测试来衡量人的外向或平易近人程度。像其他人格特征一样，我们推测，量刑的严重程度与基因、生活阅历以及人格的其他方面相关，但这些因素与法官们审判的案件或被告无任何关系。我们用“水平噪声”（level noise）一词来代表每位法官所判处的平均刑期之间的变异性，这与水平误差的变异性是等同的。

模式噪声

如图6-1中黑色箭头所示，该案例的水平噪声是2.4年，系统噪声是3.4年。这两者之间的差异表明，除了法官们在平均刑期上的差异外，系统噪声还包括了其他成分，我们将这一成分称为“模式噪声”（pattern noise）。

要想理解模式噪声，我们再看一看图6-1，随机对一个单元格进行仔细观察，比如选择单元格C3。案件C对应的平均刑期在这一列的底部，你可以看到它是3.7年。现在，看一下最右侧的一列，找到3号法官对所有案件判定的刑期均值：5年。这个刑期均值比总体刑期均值少2年。如果法官严厉程度的变异是第3列中所有噪声的成因，你可能会预测，C3单元格中的刑期是3.7-2=1.7年。然而，实际上C3中的数字是4年，这表明3号法官在这一案件上表现得尤为严厉。

使用同样简单的相加逻辑，你可以推测表格中每一列的刑期。但事实上你会发现，大部分单元格中的数字与推测的数字之间存在差异。观察每一行，你会发现，法官们在自己审理的所有案件中并非表现得同样严格：在有些案件上，他们比自己量刑的平均水平严格；但在其他案件上，他们则表现得要宽容。我们将这种残存的变异称为“模式误差”（pattern errors）。如果你在表格的每一个单元格中写下这些模式误差，就会发现：对于每一位法官（行）而言，这些模式误差之和为0；对每一起案件（列）而言，它们的和也是0。但模式误差对噪声的影响不能相互抵消，因为在计算噪声时，使用的是每个单元格中数值的平方。

有一个简单方法可以证明，刑期的简单相加模型并不适用于计算噪声。你可以看到，表格的每一列底部的刑期均值从左到右依次增加，但每一行的情况却并非如此。例如，208号法官对案件O中的被告判定的刑期比案件P中的更长。如果根据每位法官判定刑期的长短排序，那么在他们的排序中，每起案件所在的位置会产生不同。

我们用“模式噪声”一词来表示上文提到的变异性，因为这种变异性反映了法官们对具体案件的态度的复杂模式。例如，一位法官总体来说比其他法官更严格，但对于白领罪犯更宽容。另外一位法官可能总体上倾向于从轻处罚，但对于惯犯更严格。还有一位法官的宽严程度跟一般法官差不多，但如果被告只是从犯，他会表现出更多的同情，而如果受害者是老年人，这位法官会更严厉。我们用“模式噪声”这个说法是为了增加可读性。模式噪声的统计术语是“法官×案件的交互作用”——可以读作“法官乘以案件”。我们要对受过统计学训练的人说声抱歉，因为对他们而言无须进行这些解读。

在刑事司法的背景下，对案件的一些独特反应可能体现了法官的个人量刑哲学。其他的反应可能来自法官本人都没有意识到的联想，例如，被告让他想起一个特别可恨的罪犯，或是被告长得像他的孩子。无论原因是什么，这些模式并不是偶然出现的。我们可以推测，如果重审同样的案件，他们还会做出相同的反应。然而，模式噪声在实践中很难预测，这导致本已像抽签一样的审判更加充满不确定性。这项研究的作者指出：“法官受犯罪情节或被告特征的影响而导致审判中出现模式化的差别”，是“同罪不同罚的另一种形式”。

你可能已经注意到，将系统噪声分解成水平噪声和模式噪声，与第5章提到的误差方程（将误差分解为噪声和偏差）遵循的是同样的逻辑。对噪声方程的具体表述请见下面。

系统噪声2

水平噪声2

模式噪声2

System Noise2

Level Noise2

Pattern Noise2

这个方程也可以采用误差方程那样的视觉表现形式（见图6-2）。我们将三角形的两条直角边表现为相等的长度。这是因为，在审判研究中，模式噪声和水平噪声对系统噪声的贡献几乎相同。

图6-2　分解系统噪声

模式噪声无处不在。医生决定患者是否需要住院，公司决定雇用谁，律师决定受理哪些案件，好莱坞的高管决定制作哪些电影……所有这些案例中都会存在模式噪声，不同的判断者会做出不同的判断。

噪声的成分

我们对模式噪声的处理掩盖了一个重要的复杂性：随机误差可能对模式噪声产生影响。

回想一下秒表实验：你连续测量10秒的时间长度，但每一次的测量结果与前一次都可能存在差别，此时你表现出了个体内的差异。同样，如果要求法官们在其他场景中再次为16起案件量刑，他们做出的量刑结果也不可能和第一次完全相同。事实上，正如你所见，如果该实验分别在同一个星期内的不同两天开展，他们做出的量刑结果也可能不同。如果法官因为种种原因（比如他的孩子有好事发生，他钟爱的球队昨晚赢得了比赛，或是天气很好）而心情愉快，那么他的判决会比其他时候更宽容。个体内的这种变异性与我们已经讨论过的个体间的稳定变异不同，但我们很难将这两种变异的成因区分开来。我们将这种转瞬即逝的因素所导致的变异称为情境噪声。

我们有意忽视了本研究中的情境噪声，而选择将噪声审查中法官独特的审判模式解释为稳定的态度。这一假设无疑过于乐观，但我们有理由相信，情境噪声在本研究中并未产生很大影响。参与这项研究的都是经验丰富的法官，他们对被告及其所犯罪行各项特征的意义已经具有一些固定的看法。在下一章，我们将更详细地讨论情境噪声，并展示如何将其与稳定的模式噪声进行区分。

总而言之，我们讨论了几种类型的噪声。系统噪声是由多个个体对同一案例进行判断时产生的不必要的变异。我们发现了噪声的两个主要成分。当同一批人评估多个案例时，我们就可以对这两种成分进行区分。

·　水平噪声是指不同法官做出的判决与平均值之间的变异。

·　模式噪声是指法官对特定案件做出的反应的变异。

在本研究中，水平噪声和模式噪声的数量几乎相等。然而，模式噪声中肯定会包含一些情境噪声，后者可以被看作随机误差。

我们借由在司法系统中进行的噪声审查对此进行了说明，同样的分析也适用于其他所有领域，比如商业、医疗、政府管理等。水平噪声和模式噪声（包括情境噪声）都会导致系统噪声，我们随后将多次介绍它们。

阅读时长

核心概念

章节学习

第6章 噪声分析：所有判断都存在3类噪声

第6章噪声分析：所有判断都存在3类噪声