学习进度

0%

阅读时长

未满 1 分钟

最近阅读:未开始阅读

核心概念

待提炼

章节学习

  • 1

    献词

    献给诺加、奥里和吉利 ——丹尼尔·卡尼曼 献给范丁和莱莉亚 ——奥利维耶·西博尼 献给萨曼莎 ——卡斯·R.桑斯坦

    待学习
    开始阅读
  • 2

    重磅赞誉

    从“偏差”到“噪声”,作为心理学家的卡尼曼,挑战的是经济学的“理性人”假设,并因开启了行为经济学的大门而获得诺贝尔经济学奖。他一直关注的是人类在决策中是如何犯错的,在这本书中,他深入分析了噪声的影响,但也乐观地预期,可以通过发掘埋没在大数据中的信息来减少决策中的噪声,这可以说是大数据渗透到行为经济学领域的新趋势。 巴曙松 北京大学汇丰金融研究院执行院长,中国

    待学习
    开始阅读
  • 3

    测一测 如何做一个聪明的决策者?

    测一测 如何做一个聪明的决策者? 想知道你的判断 是怎么掉入噪声陷阱的吗? 扫码测一测, 立即获取答案及解析, 看看你的“降噪等级”。 1.卡尼曼是世界上第一个凭借心理学研究获得诺贝尔经济学奖的人。这个说法对吗? A.对 B.不对 2.卡尼曼指出:人类判断出错的原因有两种。一种是偏差,另一种是什么呢? A.误差 B.噪声 C.系统认知 3.在做一个判断时,以

    待学习
    开始阅读
  • 4

    推荐序1 在无法回避噪声的世界,更好地追求高级境界与极致效益

    推荐序1 Preface 在无法回避噪声的世界, 更好地追求高级境界与极致效益 彭凯平 清华大学社会科学学院院长 每年七八月份,我都会参加清华大学的本科生招生工作,由此而目睹了一个问题:高考揭榜之后,高中毕业生及其家长应如何做好志愿填报?学校和专业的选择非常重要,很有可能会决定一个学生一辈子的命运,其中牵涉的问题就与我们心理学中一个重要的研究领域紧密相关,那

    待学习
    开始阅读
  • 5

    推荐序2 穿越噪声的决策

    推荐序2 Preface 穿越噪声的决策 朱宁 上海交通大学上海高级金融学院金融学教授,副院长 我抱着浓厚的兴趣读完了诺贝尔经济学奖得主丹尼尔·卡尼曼教授等的新作《噪声》一书,这本书汇集了卡尼曼教授近十年的最新发现。对于我所从事的行为金融学研究领域而言,《噪声》算得上是一本“专业书”,但是读完之后,我认为它很可能是卡尼曼教授继《思考,快与慢》后,又一次成功将

    待学习
    开始阅读
  • 6

    中文版序 哪里有判断,哪里就有噪声

    中文版序 Preface 哪里有判断,哪里就有噪声 我们非常荣幸,也非常感激,能够在中国出版这本书。《噪声》重点关注人类的判断,关注它是如何出错的,以及如何让它变得更好。无论是医学、法律、公共政策、商业,还是日常生活领域中,我们做出判断的过程中存在的问题,是偏好根据经验做判断的人类的共性问题。 数十年来,偏差问题备受瞩目。在《思考,快与慢》一书中,本书的作者

    待学习
    开始阅读
  • 7

    引言 偏差与噪声,人类判断的两类错误

    引言 Introduction 偏差与噪声,人类判断的两类错误 试想一下,你的朋友组成了A、B、C、D共4支队伍,来到一个射击场。每队中有5个人,他们共用一支来复枪,且每人只开了一枪。图0-1显示了他们的射击结果。 图0-1 4支队伍的射击结果 理想情况是,每一枪都能正中靶心。 A队几乎达到了理想情况,他们的每一发子弹都紧紧围绕着靶心,接近完美模式。 B队的

    待学习
    开始阅读
  • 8

    第1章 犯罪和充满噪声的判罚

    第1章 犯罪和充满噪声的判罚 假设某人被指控犯了罪,例如到商店行窃、私藏海洛因、袭击他人或持枪抢劫,该案件可能的判决结果是什么? 答案不应取决于该案件恰巧被指派给哪位法官、天气是冷是热,以及当地球队在前一天是输是赢。如果3个背景类似的人被指控犯有同一罪行,最后却得到截然不同的处罚,例如第一个人被判缓刑,第二个人被判2年有期徒刑,最后一个人被判10年有期徒刑,

    待学习
    开始阅读
  • 9

    第2章 系统噪声,给人达成一致的错觉

    第2章 系统噪声,给人达成一致的错觉 我们最初接触噪声,并对这个主题产生兴趣,并不是因为遇到了像刑事司法案件那般富有戏剧性的案例。实际上,这次邂逅纯属偶然,缘于一家保险公司,这家公司与我们中的两人所属的咨询公司有合作。我们的研究揭示了营利性组织中存在噪声问题的严重性——组织会因为决策中的噪声损失惨重。我们在保险公司的经历有助于解释为什么噪声问题常常被忽视,以

    待学习
    开始阅读
  • 10

    第3章 单一决策,仅发生一次的重复决策

    第3章 单一决策,仅发生一次的重复决策 到目前为止,我们所讨论的案例研究都与重复决策相关。比如,对盗窃犯的恰当判决是什么?对某一特定风险该收取多少保费?虽然每个具体的案例在某种意义上都是独特的,但像这样的判断属于重复决策。医生诊断患者,法官审理假释案件,招生人员审查入学申请书,会计师准备税单等,这些都是重复决策。 正如前一章所介绍的,重复决策中的噪声可以通过

    待学习
    开始阅读
  • 11

    第4章 什么是判断

    第4章 什么是判断 本书论述的是一般意义上的专业判断,我们假设如果做判断的人有足够的能力,就能做出准确的判断。然而,判断这一概念本身包含着一个你不得不承认的事实:你永远无法确定一个判断是不是准确。 请思考“判断问题”和“主观判断”这两个短语的差别。我们认为“太阳明天会升起”或“NaCl是氯化钠的化学式”这样的陈述并非判断,因为任何理性的人都会完全同意上述观点

    待学习
    开始阅读
  • 12

    第5章 测量误差,噪声与偏差的代价一样大

    第5章 测量误差,噪声与偏差的代价一样大 显而易见的是,一致性的偏差会引发代价高昂的错误。如果体重秤在你每次称体重时都自动加上一定的重量,如果一位乐观的经理总是预测项目只需花费实际所需时间的一半,如果一位谨小慎微的经理总是年复一年地低估未来的销售额,那么后果都将会非常严重。 我们已经知道,噪声会引发代价高昂的错误。如果一位经理大多数时候预测的项目所需时间只是

    待学习
    开始阅读
  • 13

    第6章 噪声分析:所有判断都存在3类噪声

    第6章 噪声分析:所有判断都存在3类噪声 在上一章,我们讨论了单个案例中测量或判断的变异性。在单个案例中,判断的所有变异性都是误差,而误差由偏差和噪声组成。我们考察的判断系统,包括法院和保险公司的判断系统,它们的目的在于处理不同案例,并对这些案例进行区分。如果美国的联邦法官和保险理赔员对他们手头的所有案例都做出相同的判断,那他们就没有什么存在的价值了。对不同

    待学习
    开始阅读
  • 14

    第7章 情境噪声,无时无刻不在影响着我们的判断

    第7章 情境噪声,无时无刻不在影响着我们的判断 想象一名职业篮球运动员正在准备罚球的场景:他站在罚球线上,全神贯注地准备投篮。这是他练习过无数次的一系列动作,他能投中吗?我们无法预知结果。 在NBA的比赛中,球员们通常能够4罚3中。显然,一些球员比其他球员表现得更好,但没有人能做到百发百中(3)。虽然篮筐一直都是距离地面3.05米,与罚球线的垂直距离一直是4

    待学习
    开始阅读
  • 15

    第8章 群体是如何放大噪声的

    第8章 群体是如何放大噪声的 个体判断中存在噪声的结果已经很糟糕了,但群体决策中的噪声危害更甚。群体决策可能会由于一些无关因素而朝任何一个方向改变。谁先发言、谁后发言,谁说话更自信,谁穿着黑色衣服,谁和谁挨着坐,谁在某个时刻笑了/皱眉了/呈现出其他身体姿势……所有这些因素都会影响结果。相似的群体每一天都会做出各种不同的决策,如雇用、晋升、破产、沟通策略、环境

    待学习
    开始阅读
  • 16

    第9章 判断与模型,简单的模型普遍优于人类判断

    第9章 判断与模型,简单的模型普遍优于人类判断 很多人都对预测未来的工作绩效感兴趣,不只是自己的,还有别人的。因此,绩效预测是用来考察预测性判断的实用例子。例如,一家大公司在招聘高管时,聘请了一家专业咨询公司对两名候选人莫妮卡和娜塔莉进行评估,并以取值为1~10分的量表对两人的领导力、沟通能力、人际交往能力、职业技能、应聘动机等维度进行打分(见表9-1)。你

    待学习
    开始阅读
  • 17

    第10章 无噪声的规则

    第10章 无噪声的规则 近年来,人工智能(Artificial Intelligence)特别是机器学习技术让机器能够执行许多以前只有人类才能执行的任务。机器学习算法可以承担人脸识别、语言翻译、分析医学影像等任务,并且可以以惊人的速度和准确性来处理计算问题,例如为成千上万名驾驶员迅速规划行车路线。它们还可以执行困难的预测任务:预测美国最高法院的判决;识别哪些

    待学习
    开始阅读
  • 18

    第11章 哪里有预测,哪里就有客观无知

    第11章 哪里有预测,哪里就有客观无知 我们经常同一些公司高管分享第9章和第10章中的研究内容,并通过发人深省的发现让他们意识到人类的判断是有限的。这些发现已经存在了半个多世纪,应该很少有人能避开它们,但人们仍然对这些发现很抵触。 在我们的听众里,有一些高管会很自豪地告诉我们,相比于定量分析,他们更相信自己的直觉;其他人虽然没明说,但他们也有同样的看法。有关

    待学习
    开始阅读
  • 19

    第12章 常态谷:事情虽无法预测,但可以被理解

    第12章 常态谷:事情虽无法预测,但可以被理解 现在我们来考虑一个更大的问题:在这个世界上,有些问题容易解决,有些问题却充满了客观无知,那我们应如何自处呢?毕竟,在存在很严重的客观无知的情况下,我们很快就能意识到,用水晶球来预测未来是徒劳的,但我们通常并不会对这个世界产生这种体验。相反,正如上一章所提到的,我们一直在基于少量的有用信息来对未来做出大胆预测。在

    待学习
    开始阅读
  • 20

    第13章 启发式、偏差与噪声

    第13章 启发式、偏差与噪声 本书是对横跨半个世纪的关于人类直觉判断研究的延续,也就是所谓的“启发式和偏差研究项目”(heuristics and biases program)。《思考,快与慢》一书对该研究项目前40年的研究内容进行了回顾,探讨了能够解释“直觉思维的奇妙与缺陷”的心理机制。该项目的核心思想是,当回答一个难题时,人们会使用简化的思维操作系统—

    待学习
    开始阅读
  • 21

    第14章 匹配,找到与你的预测最精准匹配的共识

    第14章 匹配,找到与你的预测最精准匹配的共识 现在请看向天空,你认为两小时内下雨的可能性有多大?你可能很容易就答出了这个问题。你做出判断时毫不费力。你可能在不知不觉中就把对天空黑暗程度的评估转换成了概率判断。 你刚刚做的事就是一种典型的“匹配”(matching)。我们将判断描述为一种思维操作,该思维操作会为主观印象或印象的某个方面在量表上找到对应的值。匹

    待学习
    开始阅读
  • 22

    第15章 选取精确的量表,并多用相对判断

    第15章 选取精确的量表,并多用相对判断 假设你是民事审判案件中的一名陪审员。你目前所掌握的证据大致如下,你要据此做出判断。 琼·格洛弗(Joan Glover)诉General Assistance公司案 一个名叫琼·格洛弗的6岁小女孩吞下了大量非处方抗过敏药AllerFree,需要住院治疗很长时间。大剂量的药物使她的呼吸系统变得很脆弱,因此她很容易患上哮

    待学习
    开始阅读
  • 23

    第16章 模式噪声的构成

    第16章 模式噪声的构成 还记得朱莉吗?我们在第14章中提到的那个早慧的孩子。你曾尝试预测她的大学GPA。以下是有关朱莉的详细介绍。 朱莉是独生女。她的父亲是一位事业有成的律师,母亲是一位建筑师。朱莉大约3岁时,她的父亲患上了一种自体免疫性疾病,不得不居家办公。他花大量的时间陪伴朱莉,并耐心地教她读书识字。朱莉4岁时就能流畅地阅读。她的父亲也曾尝试教她算术,

    待学习
    开始阅读
  • 24

    第17章 噪声源,偏差是引人注目的图形,而噪声是不受我们关注的背景

    第17章 噪声源,偏差是引人注目的图形,而噪声是不受我们关注的背景 哪里有判断,哪里就有噪声,希望你现在也认同这一观点。我们也希望,对你而言这已不再是一件超乎想象的事。这也正是我们着手开展研究的主要动力。经过多年的努力,我们对这个问题的思考已经逐渐深入和完善。现在,来回顾一下我们已经了解的噪声成分、这些成分对噪声的重要影响以及它们在判断中所起的作用。 噪声成

    待学习
    开始阅读
  • 25

    第18章 卓越的判断者,卓越的判断力

    第18章 卓越的判断者,卓越的判断力 至目前为止,我们主要谈论的是人类的判断,而没有对不同的判断者进行区分。显然,在任何一项任务中,有些人做出的判断要优于其他人。即使是由群体做出的判断,如果该群体由高能力个体组成,那么最终的判断也会更优。这就引出了一个重要的问题,即如何甄别出更好的判断者。 有三件事至关重要。如果做判断的人受过良好的训练、更睿智且拥有正确的认

    待学习
    开始阅读
  • 26

    第19章 消除偏差与决策卫生

    第19章 消除偏差与决策卫生 许多研究人员和机构都力图减少判断偏差。在本章中,我们将分析他们的核心发现。我们将介绍消除偏差的各类干预措施之间的区别,并探讨其中一种值得进一步研究的干预措施。随后,我们将讨论如何减少噪声,并介绍决策卫生的概念。 干预:事后及事前消除偏差 减少偏差有两种主要方式,要描述它们的特点,一个好方法是回到测量类比。假设你家浴室里的体重秤在

    待学习
    开始阅读
  • 27

    第20章 司法科学,信息排序是最大的噪声

    第20章 司法科学,信息排序是最大的噪声 2004年3月,在西班牙首都马德里,一组被放置在通勤列车上的炸弹爆炸,造成192人死亡,2000多人受伤。人们在犯罪现场的塑料袋上发现了一枚指纹,并通过国际刑警组织将其传送到了世界各地的执法机构。几天后,美国联邦调查局(FBI)犯罪实验室最终确认这枚指纹属于一个居住在俄勒冈州的美国公民布兰登·梅菲尔德(Brandon

    待学习
    开始阅读
  • 28

    第21章 甄选与汇总,超级预测的两大策略

    第21章 甄选与汇总,超级预测的两大策略 许多判断都涉及预测,比如,下个季度的失业率可能是多少?明年将售出多少辆电动汽车?2050年的气候变化会带来什么影响?盖完一幢新楼需要多长时间?某家公司的年收入是多少?新员工会有什么样的表现?新的空气污染管理制度的成本是多少?谁将赢得选举?这些问题的答案会产生重大影响,因为私人机构和公共机构的一些重要选择往往取决于这些

    待学习
    开始阅读
  • 29

    第22章 医疗决策,用科学的诊断指南减少噪声

    第22章 医疗决策,用科学的诊断指南减少噪声 几年前,我们的一位好朋友保罗被他的主治医师琼斯诊断为患有高血压。琼斯医生建议保罗尝试药物治疗,他给保罗开了利尿剂,但保罗的血压依旧很高,也就是说药物没起到效果。几个星期后,琼斯又开了第二种药物——钙通道阻滞剂,但效果依然不理想。 这些结果使琼斯困惑不已。虽然过去的3个月保罗每星期都会来复诊,但他的血压只是略有下降

    待学习
    开始阅读
  • 30

    第23章 绩效评估,用基于外部视角的共识框架做出量化判断

    第23章 绩效评估,用基于外部视角的共识框架做出量化判断 让我们从一个练习开始:请选出3个你认识的人,他们可以是你的朋友或同事。请在友善、智慧和勤奋这3种特质上给他们进行1~5分的评分,其中1分是最低分,5分是最高分。现在再请另一个很了解他们的人(这个人可以是你的配偶、好友或者最亲密的同事)用同样的方式对这3个人进行评分。 在某些评估中,你和其他评分者很可能

    待学习
    开始阅读
  • 31

    第24章 人员招聘,以结构化指标衡量人才

    第24章 人员招聘,以结构化指标衡量人才 如果你曾经找过工作,那么“招聘面试”这个词可能会唤起你的一些生动而紧张的回忆。工作面试,即求职者与未来的主管或人力专员会面,是进入许多组织的必经之路。 在大多数情况下,面试遵循着既定的流程。在寒暄之后,面试官会要求应聘者描述他们的个人经历,或者详细地描述他们经历过的某些特定情形。再问一些诸如个人成就与挑战、工作动机以

    待学习
    开始阅读
  • 32

    第25章 中介评估法,做出明智决策的核心方法

    第25章 中介评估法,做出明智决策的核心方法 不久前,我们两个人(卡尼曼和西博尼)与我们的朋友丹·罗瓦洛(Dan Lovallo)一起,介绍过组织中使用的一种决策方法。这一方法的首要目的在于减少噪声,我们称之为中介评估法。该方法涵盖了我们前几章所介绍的大多数决策卫生策略,并且它的应用范围很广泛,只要在计划或选项的评估过程中需要考虑和权衡多维度信息,我们就可以

    待学习
    开始阅读
  • 33

    第26章 减少噪声的成本

    第26章 减少噪声的成本 每当我们建议人们消除噪声时,他们可能会以成本过高为由进行反对,并认为在极端情况下,减少噪声根本不可能。我们已经在商业、教育、政府以及其他领域听到过这种反对意见,这种观点虽然有一定的合理性,但言过其实了,或者只不过是一个借口。 为了证明我们的这种反对意见更有说服力,举一个高中老师为文章评分的例子。有位高中老师每星期都要对学生撰写的25

    待学习
    开始阅读
  • 34

    第27章 尊严,人之为人的重要价值观

    第27章 尊严,人之为人的重要价值观 设想如下三个场景:你申请房产抵押,但被拒绝,其原因并非有人实际考察了你的情况,而是因为银行有严格的规定,认为你这种信用等级的人不能申请房产抵押;你的条件很出色,而且一家公司的面试官也觉得你很不错,但你的求职申请被拒绝了,原因是15年前你曾被判刑,而该公司明令禁止录用任何有犯罪前科的人;你被判有罪,但不能被保释,这并非由于

    待学习
    开始阅读
  • 35

    第28章 规则还是标准

    第28章 规则还是标准 如果我们的目标是减少噪声和了解如何减少噪声(或在多大程度上减少噪声),那么我们就有必要区分两种约束行为的方式:规则和标准。很多组织通常会选择其中的一种,或将两者结合起来使用。 在商业领域,某家公司可能会有以下要求:员工必须在指定的时间内工作;每个人的休假时间不能超过两个星期;如果有人将公司的秘密泄露给媒体,那么他就会被解雇。我们也可以

    待学习
    开始阅读
  • 36

    回顾与总结 正视噪声问题

    回顾与总结 正视噪声问题 噪声是我们在做判断时不希望存在的变异,然而噪声实在太多了,本书的核心目标就在于解释为何会如此,以及我们应该如何应对噪声。本书涵盖的内容十分丰富,我们在这里仅从一个宽泛的视角来对书中的核心观点进行简要的回顾和总结。 判断不是计算,也无须遵循精确的规则 需要注意的是,不要把本书中的“判断”一词与“思考”一词混淆。判断是一个相对狭义的概念

    待学习
    开始阅读
  • 37

    结语 一个噪声很少的世界

    结语 一个噪声很少的世界 请想象一下,经过重新设计并减少了噪声的组织会是什么样子。医院、招聘委员会、经济预测机构、政府机构、保险公司、公共卫生机构、刑事司法系统、律师事务所和大学,都会对噪声问题保持警觉,并努力减少这些问题。噪声审查将会成为惯例,或许每年都能进行一次。 未来,组织的领导者将会在更多领域中使用算法来代替人类判断,或将其作为人类判断的补充。人们会

    待学习
    开始阅读
  • 38

    附录1 如何进行噪声审查

    附录1 如何进行噪声审查 附录1是一份关于如何进行噪声审查的实用指南。你可以以企业顾问的视角来阅读这部分内容,设想一下这家企业雇用你来对它的一个部门员工的专业决策进行噪声审查。 顾名思义,噪声审查的重点当然在于考察噪声的普遍性,然而,良好的噪声审查其实也能提供关于员工培训和工作监管中存在的偏差、盲点和缺陷的有价值信息。成功的审查有利于促进部门改革,包括改进专

    待学习
    开始阅读
  • 39

    附录2 决策观察者检查清单

    附录2 决策观察者检查清单 本附录给出了一份决策观察者(见第19章)检查清单的通用示例。这里提供的清单大致遵循做重要决策的时间顺序。 清单中每一项之后的参考问题都对相应的项目做了进一步说明。决策观察者在审视决策过程时应该问自己这些问题。 决策观察者不应照搬照抄这个清单。我们希望它发挥的作用是为决策观察者提供灵感和基准,并使决策观察者能够据此设计出适合自己的偏

    待学习
    开始阅读
  • 40

    附录3 对抗噪声,修正预测

    附录3 对抗噪声,修正预测 匹配性预测是我们依赖直觉式匹配过程而产生的错误(参见第14章)。当我们基于现有信息做预测时,我们会进行匹配性预测,就好像我们能够依据这些信息对结果做出完美的或准确率非常高的预测一样。 让我们来回顾一下朱莉的例子,她4岁就能流利地阅读,那么她在大学时的GPA会是多少呢?如果你预测朱莉在大学时的GPA是3.8,这就意味着你从直觉上判断

    待学习
    开始阅读
  • 41

    致谢

    我们要感谢很多人。林内亚·甘地(Linnea Gandhi)是我们的参谋长,她为我们提供了大量的指导和帮助,使我们的工作可以有条不紊地推进,让我们的工作充满欢声笑语。基本可以说,是她主持了本书的撰写。除此之外,她还为本书的初稿提出了许多宝贵建议,没有她,我们无法顺利完成本书。丹·罗瓦洛对成书也起到了非常重要的作用,本书的观点最初就源于他与人合著的一篇文章。我

    待学习
    开始阅读
  • 42

    译者后记

    汪祚军 中国科学院心理研究所博士,宁波大学教授 感谢编辑部独具慧眼,能够邀请中国科学院心理研究所李纾研究员领衔本书的翻译工作。李纾老师是国内最早从事行为决策研究的专家,在行为决策领域深耕数十年,其提出的“齐当别”决策模型在心理学界具有重要的影响力。作为行为决策领域的一名研究者、李纾老师曾经的博士生,能够参与本书的翻译工作,我深感荣幸。 在拿到本书的英文原书后

    待学习
    开始阅读
  • 43

    注释

    引言 偏差与噪声,人类判断的两类错误 射击场只是一种隐喻:1778年,瑞士数学家丹尼尔·伯努利(Daniel Bernoulli)在一篇关于评估问题的论文中使用弓和箭进行了相同的类比。Bernoulli, “The Most Probable Choice Between Several Discrepant Observations and the For

    待学习
    开始阅读

Local EPUB Text

第5章 测量误差,噪声与偏差的代价一样大

第5章 测量误差,噪声与偏差的代价一样大

显而易见的是,一致性的偏差会引发代价高昂的错误。如果体重秤在你每次称体重时都自动加上一定的重量,如果一位乐观的经理总是预测项目只需花费实际所需时间的一半,如果一位谨小慎微的经理总是年复一年地低估未来的销售额,那么后果都将会非常严重。

我们已经知道,噪声会引发代价高昂的错误。如果一位经理大多数时候预测的项目所需时间只是实际所需时间的一半,而在少数预测中又将前者估计成后者的两倍,那么我们是否可以说在平均水平上这位经理的判断是对的呢?答案是否定的。这些不同的误差是累加的,而不会互相抵消。

因此,我们想到了一个很重要的问题:偏差和噪声是如何引起误差的?多少偏差和噪声会引起误差?本章试图回答这些问题。这一章所要呈现的信息非常明确:在各种专业判断中,当以准确性为目标时,偏差和噪声在计算总体误差时扮演着相同的角色。在有些案例中,偏差是误差的主导因素;在其他案例中,噪声则是主导因素,而且这类案例比我们预想的更为常见。但在每一个案例中,每减少一个单位的噪声对总体误差的影响和每减少一个单位的偏差对总体误差的影响是一样的。因此,测量和减少噪声应该与测量和减少偏差同等重要。

这一结论是依据一种特定的误差测量方法得出的,这种测量方法由来已久,并且被科学界和统计学领域广泛接受。我们将在本章对其历史进行回顾,并简单介绍它的原理。

GoodSell应该减少噪声吗

假设有一家名为GoodSell的大型零售公司,这家公司雇用了一些销售预测师,他们的工作就是预测GoodSell在各地区的市场份额。可能是由于读过关于噪声的图书,预测部门的主管埃米·西姆金(Amy Simkin)进行了噪声审查。所有预测师都对同一个地区的市场份额进行了独立评估。

图5-1显示了噪声审查的结果(平滑得难以置信)。西姆金可以看到,这些预测分布在常见的钟形曲线(即正态分布,或称高斯分布)中。

图5-1 GoodSell公司在某一地区市场份额的预测分布

频率最高的预测由钟形曲线的顶点所代表,市场份额为44%。西姆金可以看到,公司的预测系统具有很高的噪声:如果所有预测都是正确的,那么这些预测应该相同。但事实上,这些预测值的分布很分散。

我们可以给GoodSell预测系统中的噪声赋予一个数值。就像用秒表来测量间隔时间一样,我们可以计算这些预测的标准差。顾名思义,标准差表示一组数值偏离平均值的程度,在本例中为10%。对于每一个正态分布来说,大约2/3的预测值都落在偏离平均值正负一个标准差的范围内。本例指的是,约2/3的市场份额落在34%~54%这一范围内。西姆金现在获得了一个关于市场份额噪声的评估数据。需要提醒读者的是,为了获得更加稳健的评估,更好的噪声审查可以使用几个预测问题,但此处有一个问题就够了。

在第2章中,关于真实保险公司高管的案例也是如此。西姆金感到非常震惊,并决定采取措施。令人难以接受的噪声程度表明,预测师没有遵循他们应该遵循的程序。西姆金要求公司领导雇用一个噪声顾问来监督预测师的工作,从而提升他们的一致性。可惜,她的要求并未得到批准。领导的回复似乎也很合理:“当我们不知道自己的预测是对是错的时候,如何能够减少错误?如果平均起来错误很大(即存在一个较大的偏差),那它是一个需要尽快解决的问题。”最后,领导得出结论:GoodSell先需要确认这些预测师的预测是对是错,然后再谈改善预测品质的措施。

在那次噪声审查的一年后,预测师们所预测内容的真实结果出来了。目标地区的市场份额实际为34%。现在我们知道了每一位预测师的误差程度,即他们的预测值与实际结果之间的差异。如果预测值是34%,那么误差是0;如果预测值是44%,那么误差是10%;而对于很低的预测值24%,误差为-10%。

图5-2显示的是误差分布情况。它和图5-1中的预测曲线相同,不同的只是它的每一个数据点表示了将图5-1中相应的预测值减去真实值(34%)后的差。分布的形态没有改变,而且误差分布的标准差(我们对预测误差本身的噪声的测量结果)仍然是10%。

图5-2 GoodSell对某一地区市场份额预测中的误差分布

观察图5-1和图5-2之间的差异,就像图0-1和图0-2中从正面和隐去靶子观察射击规律之间的差异。在考察射击故事中的噪声时,我们无须知道靶子的位置,同样,知道真实结果对于预测噪声也无任何助益。

西姆金和她的领导现在知道了一些他们以前不知道的信息:预测的偏差数量。偏差是误差的平均值,在本例中是10%。因此,偏差和噪声在此案例的数据集中是一个相同的数字。(需要说明的是,噪声和偏差相等不是普遍的情况,但采用一个噪声和偏差相等的案例有助于读者理解它们各自的作用。)我们可以看到,大部分预测师都犯了过度乐观的错误,他们高估了公司可能获得的市场份额,大部分人的预测都落在了0误差线的右侧。事实上,结合该正态分布曲线的属性来看,大约84%的预测都高估了实际的市场份额。

面对上述结果,西姆金的领导自鸣得意地认为自己是对的,这些预测中存在着大量偏差!减少偏差固然是一件好事,但西姆金还是想知道,一年前的提议是明智的吗?就目前而言,再次提出减少噪声仍然明智吗?相比于减少偏差,减少噪声的意义是什么呢?

均方,衡量整体误差的精确规则

为了回答西姆金的问题,我们需要一个关于误差的评分规则,即对个体误差赋予不同权重并将其整合成测量总体误差的一个指标。幸运的是,这种工具确实存在,那就是“最小平方法”(method of least squares,也叫“最小二乘法”),它是由德国数学家高斯于1795年发明的。高斯是举世闻名的数学天才,生于1777年。他在十几岁时就做出了多项重大贡献。

高斯提出了一种方法,用于评估单个误差对总体误差的影响。他在测量总体误差时,使用的是“均方误差”(Mean Squared Error,MSE),即个体误差平方的平均值。

详细探讨高斯对总体误差的测量超出了本书的讨论范畴,而且他的解决方案并非直观易懂。为什么用均方呢?这是一个听起来有些奇怪的概念,但它建立在我们几乎所有的直觉上。

为了弄明白其中的原因,让我们来看一个看上去似乎完全不同但其实本质相同的问题。想象一下,你用一把尺子来测量一条线段的长度,要求精确到毫米,并且你可以测量5次。测量结果分别用图5-3中指向下方的三角箭头表示。

图5-3 对同一线段长度的5次测量结果

正如你看到的,5次测量结果都在971~980毫米这一范围内。那么,哪一个是对这条线段的最精确测量呢?一个可能是中位数,即两个最短的测量结果和两个最长的测量结果之间的那个测量结果,在本例中为973毫米。另一种可能是算术平均值,通常被称为平均值,在本例中为975毫米(图5-3中指向上方的三角箭头)。你可能倾向于认为平均值更为精确,你的直觉是对的。平均值包含更多信息,它受测量次数的影响,而中位数只受顺序的影响。

我们对实现最佳评估这一问题有很清晰的直觉,它与我们关注的对总体误差的测量关系紧密。它们实际上是同一个问题的两面,因为最佳评估能够使当前测量的总体误差最小化。因此,如果你凭直觉认为平均值是最佳测量结果,并且你的直觉没有错的话,那么用于测量总体误差的公式应该能够产生算术平均值,因为算术平均值的误差是最小的。

均方误差就具有这样的特征,它是唯一能够对总体误差进行测量的概念。在图5-4中,我们假定线段的真实长度有10个可能的整数值,进而计算5次测量的均方误差。例如,如果真实值是971毫米,那么5次测量的误差就分别是0、1、2、8和9。这些误差的平方之和为150,均方为30。这是一个很大的数值,表明一些测量值离真实值很远。你会看到,当测量值接近975(平均值)时,均方误差会下降。随着测量值远离平均值,均方误差又会逐渐增加。可见,平均值是最佳评估结果,因为在这种情况下总体误差最小。

图5-4 10个可能的真实值对应的均方误差

你还会发现,当你的评估值远离平均值时,总体误差会迅速增加。例如,当你的评估值仅仅增加3毫米,如从976变化到979,均方误差就会翻倍。这是均方误差的关键特征:相比于小的误差,平方给大的误差赋予了更大的权重。

现在你应该明白了为什么高斯用于测量总体误差的公式被称为均方误差计算公式,以及这种评估方法为什么被称为最小平方法。对误差进行平方是其核心思想,其他任何公式都无法与我们的直觉——平均数是最佳评估值如此契合。

高斯的方法很快得到其他数学家的认可。作为其众多伟大成就之一,高斯用他的均方误差方法及其他数学创新解决了一大难题——重新发现谷神星(Ceres)。在此之前,这颗小行星只在1801年被短暂地追踪到,之后便消失于太阳眩光中。高斯对这一问题的解决方案优于当时欧洲最好的天文学家。这些天文学家一直想方设法估算谷神星的轨道,然而他们测量望远镜误差的方法是错误的,这颗行星根本没有在他们预测的任何地点附近出现。高斯用最小平方法重新进行了计算,当天文学家用望远镜对准高斯所预测的地点时,他们发现了谷神星!

不同领域的科学家很快就开始普遍采用最小平方法来评估误差。两个多世纪过去了,当想要达到准确测量的目标时,最小平方法仍然是评估误差的标准方法。用平方来赋予误差权重是统计学的核心。在绝大部分科学领域的应用中,均方误差方法处于绝对优势地位。正如我们将看到的,这一方法具有极高的应用价值。

单次测量中的误差

=

偏差

+

噪声误差

Error in a single measurement

=

Bias

+

Noisy Error

误差方程:无论偏差大小如何,减少噪声都有益处

偏差和噪声在误差中的作用很容易概括为两个表达式,我们将其称为误差方程。第一个误差方程将单次测量中的误差分解为你现在熟悉的两个部分:偏差(平均误差)和残留的“噪声误差”。

如果误差比偏差大,那么噪声误差是正的,反之则为负。噪声误差的平均数为0。这个误差方程并未提供什么新的信息。

第二个误差方程是对均方误差,即我们之前介绍的对总体误差测量的分解。均方误差可以简单表示为偏差和噪声的平方和。(回想一下,噪声是测量的标准差,它与噪声误差的标准差相同。)

下面的方程(两个平方之和)可能会让你想起一个学生时代常用的定理——勾股定理。或许你还记得,在一个直角三角形中,两条直角边长的平方和等于斜边长的平方。因此,误差方程式就更直观了,其中均方误差、偏差的平方和噪声的平方类似于直角三角形的三条边各自的平方。图5-5表明均方误差(黑色方块区域)的面积等于另外两个方块区域的面积之和。左图中噪声多于偏差,右图中偏差多于噪声。然而,两种情况的均方误差是相同的,均方误差的分解方程在这两种情况下都成立。

总体误差(均方误差)

=

偏差2

+

噪声2

Overall Error(MSE)

=

Bias2

+

Noise2

图5-5 均方误差的两种分解情形

正如上面的数学公式以及图5-5所示,偏差和噪声在误差方程中扮演了类似的角色,它们虽彼此独立,但被赋予了相同的权重。需要注意的是,在随后的章节中,我们在分析噪声的成分时也会用类似的平方和分解的方式。

误差方程解答了西姆金提出的问题。同等程度地减少噪声和偏差,对总体误差会产生什么影响?答案很明显:在误差方程中,偏差和噪声可以互换,因此无论是减少噪声还是减少偏差,对减少总体误差而言意义是一样的。在图5-2中,偏差和噪声刚好相等(都是10%),因而它们对总体误差的影响是等同的。

误差方程表明,西姆金最初想减少噪声的想法是正确的。无论你何时发现噪声,你都需要想尽办法减少它。这一方程表明,西姆金的领导所认为的“GoodSell应该在预测中的偏差的测量结果出来之后,再去减少噪声”的观点是错误的。对于总体误差而言,噪声和偏差是独立的:无论偏差的大小如何,减少噪声都有益处。

这个结论虽然很违反直觉,但非常重要。为了说明这一点,图5-6表明了减少相同数量的噪声和偏差所产生的效果。为了帮助你理解下图中左右两图的内容,最初的误差分布(来自图5-2)用虚线表示。

图5-6 偏差减半(A)与噪声减半(B)时的误差分布情况

在图5-6的图A中,我们假设西姆金的领导决定采用自己的方式:他发现了偏差,随后决定将其减半,如通过向过于乐观的预测师提供反馈的方式。他未对噪声采取任何措施。这种改进的效果是显而易见的:预测的总体分布更接近真实值了。

在图5-6的图B中,我们可以看到,如果西姆金的提议获得了领导的批准,其结果将会是:偏差没有改变,噪声减半。看似矛盾的是,噪声的减少似乎使问题变得更严重了——预测更加集中了(更少的噪声),而不是更准确了(并未减少偏差)。84%的预测落入真实值的一侧,几乎所有(98%)的预测都错误地高估了真实值。减少噪声似乎使预测更加不准确了——这肯定不是西姆金所希望的!

尽管看上去如此,但图5-6的图B中的总体误差和图5-6的图A中的总体误差减少的数量是一样的。图5-6的图B中情况变得更糟的错觉源自对偏差的错误直觉。测量偏差的目的并不是测量正误差和负误差之间的不平衡,而是测量平均误差,即钟形曲线的顶点与真实值之间的距离。在图5-6的图B中,这一平均误差与原始情境相比并无差异——它仍然很高,占10%,但并没有更糟糕。的确,偏差变得更加显著,因为它占了总体误差中更大的部分——80%而不是50%,但这是因为噪声减小了。相反,在图5-6的图A中,偏差减少了而噪声没有。最终的结果是,图5-6的图A和图5-6的图B中的均方误差相同,也就是说,减少噪声和减少相同数量的偏差对均方误差的影响是相同的。

正如本案例所示,均方误差与我们对预测性判断进行评分的一般直觉相冲突。为了最小化均方误差,你需要尽可能避免大的误差。例如,如果你在测量长度,那么将误差从11厘米减少到10厘米的效果是将误差从1厘米减少至完全消失的效果的21倍。可惜,关于这一点人们的直觉恰恰相反:人们非常渴望一次性把问题全部解决,对小的误差高度敏感,但对两个大的误差之间的差异不敏感。即使你真心相信你的目标在于获得准确的判断,但你对结果的直觉反应与基于科学计算的准确性并不完全匹配。

当然,最佳的解决办法是既减少噪声,也减少偏差。既然偏差和噪声是彼此独立的,那就没有必要在西姆金和其领导的方案之间二选一。因此,如果GoodSell决定减少噪声,而减少噪声又可以使偏差更加清晰明了,那么这种选择就是正确的。也就是说,这确实是一件好事。减少噪声可以帮助公司进一步减少偏差。

然而,如果偏差远远大于噪声,那么减少噪声就不再是首要问题。GoodSell的例子给了我们另一个值得重视的教训。在上述简化的模型中,我们假定噪声和偏差是等同的。从误差方程来看,它们对总体误差的影响也是等同的:偏差和噪声各贡献了总体误差的50%。然而,正如我们所注意到的,84%的分析师会在同一个方向上犯错。如此之大的偏差(7个人中约有6个人朝同一个方向犯错)才产生了与噪声一样大的效果,因此在一些噪声比偏差更多的情境中,我们发现更大的误差就不足为奇了。

我们在上文中用单个案例展示了误差方程的应用,这个案例就是预测GoodSell在某一地区的市场份额。当然,人们总是希望在多个案例中进行一次性噪声审查,方法是相同的:用误差方程计算各个案例的均方误差,然后对它们取平均值。均方误差就是偏差平方与噪声平方之和。对于西姆金而言,如果能得到多个地区的多个预测数据就更好了,无论它们是相同还是不同的预测师做出的预测。这些平均值能够让她对GoodSell的预测系统偏差和噪声有一个更清晰的认识。

噪声的代价

误差方程是本书的思想基础,它为减少预测性判断中的系统噪声提供了理论依据。原则上,减少预测性判断中的系统噪声这一目标与减少统计偏差同样重要。需要强调的是,统计偏差不是社会歧视的代名词,它只是一组判断中的平均误差。

误差方程和我们从中获得的结论均有赖于用均方误差来测量总体误差。这一规则适用于纯粹的预测性判断,包括预测和评估,它们都力求以最大的精度(最小的偏差)和最高的准确性(最小的噪声)来接近真实值。

然而,误差方程不适用于评估性判断,因为误差取决于真实值的存在,故而很难应用于评估性判断。此外,即使我们可以确定评估性判断中的误差,其代价也不太可能与它们的平方成正比。

例如,对于一家制造电梯的公司而言,评估一架电梯的最大负载的误差显然是不对称的:虽然低估意味着一定的代价,但高估可能会引发灾难。误差平方也不能用于评估“什么时候出发去赶火车”这样的决定,因为晚1分钟和晚5分钟的后果是一样的。在第2章中,当保险公司在为其保单估价或估计理赔额时,两个方向的错误都需要付出代价,但同样没有理由假定这两个的代价是对等的。

上述这些例子充分表明:需要明确预测性判断和评估性判断在决策中所起的作用。关于良好决策,一个得到普遍认可的准则是:不应混淆自己的价值判断和事实。决策需要根据客观、精确的预测性判断做出,这些判断不应受到你的希望与恐惧、偏好与价值取向的影响。对于电梯公司而言,第一步是利用不同的技术解决方案对电梯的最大技术负载进行客观计算。安全性仅仅在第二步才需要被重点关注,即根据不同的安全边际来设定最大负载时。可以肯定的是,该选择在很大程度上取决于事实判断,诸如设置不同安全边际的代价与收益。同样,决定何时出发去火车站的第一步应该由客观的旅行时间决定,至于错过火车的代价和提前到火车站所浪费的时间,只有在你需要决定甘愿冒多大风险时才成为你需要考虑的因素。

同样的逻辑适用于会产生更严重后果的决策。在决定是否发动军事进攻时,指挥官需要权衡一系列因素,但他依赖的最重要信息是预测性判断。政府官员在对公共健康危机做出回应时,需要权衡不同选项的优势和劣势,如果缺少对每一选项的可能后果的准确预测,这种评估就无法完成。

在所有这些案例中,最终的决策都需要进行评估性判断。决策者需要考虑多种选项,并根据其价值做出最佳选择。但决策取决于潜在的预测,而这种预测应该是价值中立的。他们的目标是精确性(尽可能击中靶心),均方误差是测量误差的恰当手段。我们可以通过减少噪声来改善预测性判断,如果这样做不会大幅增加偏差的话。