学习进度

0%

阅读时长

未满 1 分钟

最近阅读:未开始阅读

核心概念

待提炼

章节学习

  • 1

    献词

    献给诺加、奥里和吉利 ——丹尼尔·卡尼曼 献给范丁和莱莉亚 ——奥利维耶·西博尼 献给萨曼莎 ——卡斯·R.桑斯坦

    待学习
    开始阅读
  • 2

    重磅赞誉

    从“偏差”到“噪声”,作为心理学家的卡尼曼,挑战的是经济学的“理性人”假设,并因开启了行为经济学的大门而获得诺贝尔经济学奖。他一直关注的是人类在决策中是如何犯错的,在这本书中,他深入分析了噪声的影响,但也乐观地预期,可以通过发掘埋没在大数据中的信息来减少决策中的噪声,这可以说是大数据渗透到行为经济学领域的新趋势。 巴曙松 北京大学汇丰金融研究院执行院长,中国

    待学习
    开始阅读
  • 3

    测一测 如何做一个聪明的决策者?

    测一测 如何做一个聪明的决策者? 想知道你的判断 是怎么掉入噪声陷阱的吗? 扫码测一测, 立即获取答案及解析, 看看你的“降噪等级”。 1.卡尼曼是世界上第一个凭借心理学研究获得诺贝尔经济学奖的人。这个说法对吗? A.对 B.不对 2.卡尼曼指出:人类判断出错的原因有两种。一种是偏差,另一种是什么呢? A.误差 B.噪声 C.系统认知 3.在做一个判断时,以

    待学习
    开始阅读
  • 4

    推荐序1 在无法回避噪声的世界,更好地追求高级境界与极致效益

    推荐序1 Preface 在无法回避噪声的世界, 更好地追求高级境界与极致效益 彭凯平 清华大学社会科学学院院长 每年七八月份,我都会参加清华大学的本科生招生工作,由此而目睹了一个问题:高考揭榜之后,高中毕业生及其家长应如何做好志愿填报?学校和专业的选择非常重要,很有可能会决定一个学生一辈子的命运,其中牵涉的问题就与我们心理学中一个重要的研究领域紧密相关,那

    待学习
    开始阅读
  • 5

    推荐序2 穿越噪声的决策

    推荐序2 Preface 穿越噪声的决策 朱宁 上海交通大学上海高级金融学院金融学教授,副院长 我抱着浓厚的兴趣读完了诺贝尔经济学奖得主丹尼尔·卡尼曼教授等的新作《噪声》一书,这本书汇集了卡尼曼教授近十年的最新发现。对于我所从事的行为金融学研究领域而言,《噪声》算得上是一本“专业书”,但是读完之后,我认为它很可能是卡尼曼教授继《思考,快与慢》后,又一次成功将

    待学习
    开始阅读
  • 6

    中文版序 哪里有判断,哪里就有噪声

    中文版序 Preface 哪里有判断,哪里就有噪声 我们非常荣幸,也非常感激,能够在中国出版这本书。《噪声》重点关注人类的判断,关注它是如何出错的,以及如何让它变得更好。无论是医学、法律、公共政策、商业,还是日常生活领域中,我们做出判断的过程中存在的问题,是偏好根据经验做判断的人类的共性问题。 数十年来,偏差问题备受瞩目。在《思考,快与慢》一书中,本书的作者

    待学习
    开始阅读
  • 7

    引言 偏差与噪声,人类判断的两类错误

    引言 Introduction 偏差与噪声,人类判断的两类错误 试想一下,你的朋友组成了A、B、C、D共4支队伍,来到一个射击场。每队中有5个人,他们共用一支来复枪,且每人只开了一枪。图0-1显示了他们的射击结果。 图0-1 4支队伍的射击结果 理想情况是,每一枪都能正中靶心。 A队几乎达到了理想情况,他们的每一发子弹都紧紧围绕着靶心,接近完美模式。 B队的

    待学习
    开始阅读
  • 8

    第1章 犯罪和充满噪声的判罚

    第1章 犯罪和充满噪声的判罚 假设某人被指控犯了罪,例如到商店行窃、私藏海洛因、袭击他人或持枪抢劫,该案件可能的判决结果是什么? 答案不应取决于该案件恰巧被指派给哪位法官、天气是冷是热,以及当地球队在前一天是输是赢。如果3个背景类似的人被指控犯有同一罪行,最后却得到截然不同的处罚,例如第一个人被判缓刑,第二个人被判2年有期徒刑,最后一个人被判10年有期徒刑,

    待学习
    开始阅读
  • 9

    第2章 系统噪声,给人达成一致的错觉

    第2章 系统噪声,给人达成一致的错觉 我们最初接触噪声,并对这个主题产生兴趣,并不是因为遇到了像刑事司法案件那般富有戏剧性的案例。实际上,这次邂逅纯属偶然,缘于一家保险公司,这家公司与我们中的两人所属的咨询公司有合作。我们的研究揭示了营利性组织中存在噪声问题的严重性——组织会因为决策中的噪声损失惨重。我们在保险公司的经历有助于解释为什么噪声问题常常被忽视,以

    待学习
    开始阅读
  • 10

    第3章 单一决策,仅发生一次的重复决策

    第3章 单一决策,仅发生一次的重复决策 到目前为止,我们所讨论的案例研究都与重复决策相关。比如,对盗窃犯的恰当判决是什么?对某一特定风险该收取多少保费?虽然每个具体的案例在某种意义上都是独特的,但像这样的判断属于重复决策。医生诊断患者,法官审理假释案件,招生人员审查入学申请书,会计师准备税单等,这些都是重复决策。 正如前一章所介绍的,重复决策中的噪声可以通过

    待学习
    开始阅读
  • 11

    第4章 什么是判断

    第4章 什么是判断 本书论述的是一般意义上的专业判断,我们假设如果做判断的人有足够的能力,就能做出准确的判断。然而,判断这一概念本身包含着一个你不得不承认的事实:你永远无法确定一个判断是不是准确。 请思考“判断问题”和“主观判断”这两个短语的差别。我们认为“太阳明天会升起”或“NaCl是氯化钠的化学式”这样的陈述并非判断,因为任何理性的人都会完全同意上述观点

    待学习
    开始阅读
  • 12

    第5章 测量误差,噪声与偏差的代价一样大

    第5章 测量误差,噪声与偏差的代价一样大 显而易见的是,一致性的偏差会引发代价高昂的错误。如果体重秤在你每次称体重时都自动加上一定的重量,如果一位乐观的经理总是预测项目只需花费实际所需时间的一半,如果一位谨小慎微的经理总是年复一年地低估未来的销售额,那么后果都将会非常严重。 我们已经知道,噪声会引发代价高昂的错误。如果一位经理大多数时候预测的项目所需时间只是

    待学习
    开始阅读
  • 13

    第6章 噪声分析:所有判断都存在3类噪声

    第6章 噪声分析:所有判断都存在3类噪声 在上一章,我们讨论了单个案例中测量或判断的变异性。在单个案例中,判断的所有变异性都是误差,而误差由偏差和噪声组成。我们考察的判断系统,包括法院和保险公司的判断系统,它们的目的在于处理不同案例,并对这些案例进行区分。如果美国的联邦法官和保险理赔员对他们手头的所有案例都做出相同的判断,那他们就没有什么存在的价值了。对不同

    待学习
    开始阅读
  • 14

    第7章 情境噪声,无时无刻不在影响着我们的判断

    第7章 情境噪声,无时无刻不在影响着我们的判断 想象一名职业篮球运动员正在准备罚球的场景:他站在罚球线上,全神贯注地准备投篮。这是他练习过无数次的一系列动作,他能投中吗?我们无法预知结果。 在NBA的比赛中,球员们通常能够4罚3中。显然,一些球员比其他球员表现得更好,但没有人能做到百发百中(3)。虽然篮筐一直都是距离地面3.05米,与罚球线的垂直距离一直是4

    待学习
    开始阅读
  • 15

    第8章 群体是如何放大噪声的

    第8章 群体是如何放大噪声的 个体判断中存在噪声的结果已经很糟糕了,但群体决策中的噪声危害更甚。群体决策可能会由于一些无关因素而朝任何一个方向改变。谁先发言、谁后发言,谁说话更自信,谁穿着黑色衣服,谁和谁挨着坐,谁在某个时刻笑了/皱眉了/呈现出其他身体姿势……所有这些因素都会影响结果。相似的群体每一天都会做出各种不同的决策,如雇用、晋升、破产、沟通策略、环境

    待学习
    开始阅读
  • 16

    第9章 判断与模型,简单的模型普遍优于人类判断

    第9章 判断与模型,简单的模型普遍优于人类判断 很多人都对预测未来的工作绩效感兴趣,不只是自己的,还有别人的。因此,绩效预测是用来考察预测性判断的实用例子。例如,一家大公司在招聘高管时,聘请了一家专业咨询公司对两名候选人莫妮卡和娜塔莉进行评估,并以取值为1~10分的量表对两人的领导力、沟通能力、人际交往能力、职业技能、应聘动机等维度进行打分(见表9-1)。你

    待学习
    开始阅读
  • 17

    第10章 无噪声的规则

    第10章 无噪声的规则 近年来,人工智能(Artificial Intelligence)特别是机器学习技术让机器能够执行许多以前只有人类才能执行的任务。机器学习算法可以承担人脸识别、语言翻译、分析医学影像等任务,并且可以以惊人的速度和准确性来处理计算问题,例如为成千上万名驾驶员迅速规划行车路线。它们还可以执行困难的预测任务:预测美国最高法院的判决;识别哪些

    待学习
    开始阅读
  • 18

    第11章 哪里有预测,哪里就有客观无知

    第11章 哪里有预测,哪里就有客观无知 我们经常同一些公司高管分享第9章和第10章中的研究内容,并通过发人深省的发现让他们意识到人类的判断是有限的。这些发现已经存在了半个多世纪,应该很少有人能避开它们,但人们仍然对这些发现很抵触。 在我们的听众里,有一些高管会很自豪地告诉我们,相比于定量分析,他们更相信自己的直觉;其他人虽然没明说,但他们也有同样的看法。有关

    待学习
    开始阅读
  • 19

    第12章 常态谷:事情虽无法预测,但可以被理解

    第12章 常态谷:事情虽无法预测,但可以被理解 现在我们来考虑一个更大的问题:在这个世界上,有些问题容易解决,有些问题却充满了客观无知,那我们应如何自处呢?毕竟,在存在很严重的客观无知的情况下,我们很快就能意识到,用水晶球来预测未来是徒劳的,但我们通常并不会对这个世界产生这种体验。相反,正如上一章所提到的,我们一直在基于少量的有用信息来对未来做出大胆预测。在

    待学习
    开始阅读
  • 20

    第13章 启发式、偏差与噪声

    第13章 启发式、偏差与噪声 本书是对横跨半个世纪的关于人类直觉判断研究的延续,也就是所谓的“启发式和偏差研究项目”(heuristics and biases program)。《思考,快与慢》一书对该研究项目前40年的研究内容进行了回顾,探讨了能够解释“直觉思维的奇妙与缺陷”的心理机制。该项目的核心思想是,当回答一个难题时,人们会使用简化的思维操作系统—

    待学习
    开始阅读
  • 21

    第14章 匹配,找到与你的预测最精准匹配的共识

    第14章 匹配,找到与你的预测最精准匹配的共识 现在请看向天空,你认为两小时内下雨的可能性有多大?你可能很容易就答出了这个问题。你做出判断时毫不费力。你可能在不知不觉中就把对天空黑暗程度的评估转换成了概率判断。 你刚刚做的事就是一种典型的“匹配”(matching)。我们将判断描述为一种思维操作,该思维操作会为主观印象或印象的某个方面在量表上找到对应的值。匹

    待学习
    开始阅读
  • 22

    第15章 选取精确的量表,并多用相对判断

    第15章 选取精确的量表,并多用相对判断 假设你是民事审判案件中的一名陪审员。你目前所掌握的证据大致如下,你要据此做出判断。 琼·格洛弗(Joan Glover)诉General Assistance公司案 一个名叫琼·格洛弗的6岁小女孩吞下了大量非处方抗过敏药AllerFree,需要住院治疗很长时间。大剂量的药物使她的呼吸系统变得很脆弱,因此她很容易患上哮

    待学习
    开始阅读
  • 23

    第16章 模式噪声的构成

    第16章 模式噪声的构成 还记得朱莉吗?我们在第14章中提到的那个早慧的孩子。你曾尝试预测她的大学GPA。以下是有关朱莉的详细介绍。 朱莉是独生女。她的父亲是一位事业有成的律师,母亲是一位建筑师。朱莉大约3岁时,她的父亲患上了一种自体免疫性疾病,不得不居家办公。他花大量的时间陪伴朱莉,并耐心地教她读书识字。朱莉4岁时就能流畅地阅读。她的父亲也曾尝试教她算术,

    待学习
    开始阅读
  • 24

    第17章 噪声源,偏差是引人注目的图形,而噪声是不受我们关注的背景

    第17章 噪声源,偏差是引人注目的图形,而噪声是不受我们关注的背景 哪里有判断,哪里就有噪声,希望你现在也认同这一观点。我们也希望,对你而言这已不再是一件超乎想象的事。这也正是我们着手开展研究的主要动力。经过多年的努力,我们对这个问题的思考已经逐渐深入和完善。现在,来回顾一下我们已经了解的噪声成分、这些成分对噪声的重要影响以及它们在判断中所起的作用。 噪声成

    待学习
    开始阅读
  • 25

    第18章 卓越的判断者,卓越的判断力

    第18章 卓越的判断者,卓越的判断力 至目前为止,我们主要谈论的是人类的判断,而没有对不同的判断者进行区分。显然,在任何一项任务中,有些人做出的判断要优于其他人。即使是由群体做出的判断,如果该群体由高能力个体组成,那么最终的判断也会更优。这就引出了一个重要的问题,即如何甄别出更好的判断者。 有三件事至关重要。如果做判断的人受过良好的训练、更睿智且拥有正确的认

    待学习
    开始阅读
  • 26

    第19章 消除偏差与决策卫生

    第19章 消除偏差与决策卫生 许多研究人员和机构都力图减少判断偏差。在本章中,我们将分析他们的核心发现。我们将介绍消除偏差的各类干预措施之间的区别,并探讨其中一种值得进一步研究的干预措施。随后,我们将讨论如何减少噪声,并介绍决策卫生的概念。 干预:事后及事前消除偏差 减少偏差有两种主要方式,要描述它们的特点,一个好方法是回到测量类比。假设你家浴室里的体重秤在

    待学习
    开始阅读
  • 27

    第20章 司法科学,信息排序是最大的噪声

    第20章 司法科学,信息排序是最大的噪声 2004年3月,在西班牙首都马德里,一组被放置在通勤列车上的炸弹爆炸,造成192人死亡,2000多人受伤。人们在犯罪现场的塑料袋上发现了一枚指纹,并通过国际刑警组织将其传送到了世界各地的执法机构。几天后,美国联邦调查局(FBI)犯罪实验室最终确认这枚指纹属于一个居住在俄勒冈州的美国公民布兰登·梅菲尔德(Brandon

    待学习
    开始阅读
  • 28

    第21章 甄选与汇总,超级预测的两大策略

    第21章 甄选与汇总,超级预测的两大策略 许多判断都涉及预测,比如,下个季度的失业率可能是多少?明年将售出多少辆电动汽车?2050年的气候变化会带来什么影响?盖完一幢新楼需要多长时间?某家公司的年收入是多少?新员工会有什么样的表现?新的空气污染管理制度的成本是多少?谁将赢得选举?这些问题的答案会产生重大影响,因为私人机构和公共机构的一些重要选择往往取决于这些

    待学习
    开始阅读
  • 29

    第22章 医疗决策,用科学的诊断指南减少噪声

    第22章 医疗决策,用科学的诊断指南减少噪声 几年前,我们的一位好朋友保罗被他的主治医师琼斯诊断为患有高血压。琼斯医生建议保罗尝试药物治疗,他给保罗开了利尿剂,但保罗的血压依旧很高,也就是说药物没起到效果。几个星期后,琼斯又开了第二种药物——钙通道阻滞剂,但效果依然不理想。 这些结果使琼斯困惑不已。虽然过去的3个月保罗每星期都会来复诊,但他的血压只是略有下降

    待学习
    开始阅读
  • 30

    第23章 绩效评估,用基于外部视角的共识框架做出量化判断

    第23章 绩效评估,用基于外部视角的共识框架做出量化判断 让我们从一个练习开始:请选出3个你认识的人,他们可以是你的朋友或同事。请在友善、智慧和勤奋这3种特质上给他们进行1~5分的评分,其中1分是最低分,5分是最高分。现在再请另一个很了解他们的人(这个人可以是你的配偶、好友或者最亲密的同事)用同样的方式对这3个人进行评分。 在某些评估中,你和其他评分者很可能

    待学习
    开始阅读
  • 31

    第24章 人员招聘,以结构化指标衡量人才

    第24章 人员招聘,以结构化指标衡量人才 如果你曾经找过工作,那么“招聘面试”这个词可能会唤起你的一些生动而紧张的回忆。工作面试,即求职者与未来的主管或人力专员会面,是进入许多组织的必经之路。 在大多数情况下,面试遵循着既定的流程。在寒暄之后,面试官会要求应聘者描述他们的个人经历,或者详细地描述他们经历过的某些特定情形。再问一些诸如个人成就与挑战、工作动机以

    待学习
    开始阅读
  • 32

    第25章 中介评估法,做出明智决策的核心方法

    第25章 中介评估法,做出明智决策的核心方法 不久前,我们两个人(卡尼曼和西博尼)与我们的朋友丹·罗瓦洛(Dan Lovallo)一起,介绍过组织中使用的一种决策方法。这一方法的首要目的在于减少噪声,我们称之为中介评估法。该方法涵盖了我们前几章所介绍的大多数决策卫生策略,并且它的应用范围很广泛,只要在计划或选项的评估过程中需要考虑和权衡多维度信息,我们就可以

    待学习
    开始阅读
  • 33

    第26章 减少噪声的成本

    第26章 减少噪声的成本 每当我们建议人们消除噪声时,他们可能会以成本过高为由进行反对,并认为在极端情况下,减少噪声根本不可能。我们已经在商业、教育、政府以及其他领域听到过这种反对意见,这种观点虽然有一定的合理性,但言过其实了,或者只不过是一个借口。 为了证明我们的这种反对意见更有说服力,举一个高中老师为文章评分的例子。有位高中老师每星期都要对学生撰写的25

    待学习
    开始阅读
  • 34

    第27章 尊严,人之为人的重要价值观

    第27章 尊严,人之为人的重要价值观 设想如下三个场景:你申请房产抵押,但被拒绝,其原因并非有人实际考察了你的情况,而是因为银行有严格的规定,认为你这种信用等级的人不能申请房产抵押;你的条件很出色,而且一家公司的面试官也觉得你很不错,但你的求职申请被拒绝了,原因是15年前你曾被判刑,而该公司明令禁止录用任何有犯罪前科的人;你被判有罪,但不能被保释,这并非由于

    待学习
    开始阅读
  • 35

    第28章 规则还是标准

    第28章 规则还是标准 如果我们的目标是减少噪声和了解如何减少噪声(或在多大程度上减少噪声),那么我们就有必要区分两种约束行为的方式:规则和标准。很多组织通常会选择其中的一种,或将两者结合起来使用。 在商业领域,某家公司可能会有以下要求:员工必须在指定的时间内工作;每个人的休假时间不能超过两个星期;如果有人将公司的秘密泄露给媒体,那么他就会被解雇。我们也可以

    待学习
    开始阅读
  • 36

    回顾与总结 正视噪声问题

    回顾与总结 正视噪声问题 噪声是我们在做判断时不希望存在的变异,然而噪声实在太多了,本书的核心目标就在于解释为何会如此,以及我们应该如何应对噪声。本书涵盖的内容十分丰富,我们在这里仅从一个宽泛的视角来对书中的核心观点进行简要的回顾和总结。 判断不是计算,也无须遵循精确的规则 需要注意的是,不要把本书中的“判断”一词与“思考”一词混淆。判断是一个相对狭义的概念

    待学习
    开始阅读
  • 37

    结语 一个噪声很少的世界

    结语 一个噪声很少的世界 请想象一下,经过重新设计并减少了噪声的组织会是什么样子。医院、招聘委员会、经济预测机构、政府机构、保险公司、公共卫生机构、刑事司法系统、律师事务所和大学,都会对噪声问题保持警觉,并努力减少这些问题。噪声审查将会成为惯例,或许每年都能进行一次。 未来,组织的领导者将会在更多领域中使用算法来代替人类判断,或将其作为人类判断的补充。人们会

    待学习
    开始阅读
  • 38

    附录1 如何进行噪声审查

    附录1 如何进行噪声审查 附录1是一份关于如何进行噪声审查的实用指南。你可以以企业顾问的视角来阅读这部分内容,设想一下这家企业雇用你来对它的一个部门员工的专业决策进行噪声审查。 顾名思义,噪声审查的重点当然在于考察噪声的普遍性,然而,良好的噪声审查其实也能提供关于员工培训和工作监管中存在的偏差、盲点和缺陷的有价值信息。成功的审查有利于促进部门改革,包括改进专

    待学习
    开始阅读
  • 39

    附录2 决策观察者检查清单

    附录2 决策观察者检查清单 本附录给出了一份决策观察者(见第19章)检查清单的通用示例。这里提供的清单大致遵循做重要决策的时间顺序。 清单中每一项之后的参考问题都对相应的项目做了进一步说明。决策观察者在审视决策过程时应该问自己这些问题。 决策观察者不应照搬照抄这个清单。我们希望它发挥的作用是为决策观察者提供灵感和基准,并使决策观察者能够据此设计出适合自己的偏

    待学习
    开始阅读
  • 40

    附录3 对抗噪声,修正预测

    附录3 对抗噪声,修正预测 匹配性预测是我们依赖直觉式匹配过程而产生的错误(参见第14章)。当我们基于现有信息做预测时,我们会进行匹配性预测,就好像我们能够依据这些信息对结果做出完美的或准确率非常高的预测一样。 让我们来回顾一下朱莉的例子,她4岁就能流利地阅读,那么她在大学时的GPA会是多少呢?如果你预测朱莉在大学时的GPA是3.8,这就意味着你从直觉上判断

    待学习
    开始阅读
  • 41

    致谢

    我们要感谢很多人。林内亚·甘地(Linnea Gandhi)是我们的参谋长,她为我们提供了大量的指导和帮助,使我们的工作可以有条不紊地推进,让我们的工作充满欢声笑语。基本可以说,是她主持了本书的撰写。除此之外,她还为本书的初稿提出了许多宝贵建议,没有她,我们无法顺利完成本书。丹·罗瓦洛对成书也起到了非常重要的作用,本书的观点最初就源于他与人合著的一篇文章。我

    待学习
    开始阅读
  • 42

    译者后记

    汪祚军 中国科学院心理研究所博士,宁波大学教授 感谢编辑部独具慧眼,能够邀请中国科学院心理研究所李纾研究员领衔本书的翻译工作。李纾老师是国内最早从事行为决策研究的专家,在行为决策领域深耕数十年,其提出的“齐当别”决策模型在心理学界具有重要的影响力。作为行为决策领域的一名研究者、李纾老师曾经的博士生,能够参与本书的翻译工作,我深感荣幸。 在拿到本书的英文原书后

    待学习
    开始阅读
  • 43

    注释

    引言 偏差与噪声,人类判断的两类错误 射击场只是一种隐喻:1778年,瑞士数学家丹尼尔·伯努利(Daniel Bernoulli)在一篇关于评估问题的论文中使用弓和箭进行了相同的类比。Bernoulli, “The Most Probable Choice Between Several Discrepant Observations and the For

    待学习
    开始阅读

Local EPUB Text

第24章 人员招聘,以结构化指标衡量人才

第24章 人员招聘,以结构化指标衡量人才

如果你曾经找过工作,那么“招聘面试”这个词可能会唤起你的一些生动而紧张的回忆。工作面试,即求职者与未来的主管或人力专员会面,是进入许多组织的必经之路。

在大多数情况下,面试遵循着既定的流程。在寒暄之后,面试官会要求应聘者描述他们的个人经历,或者详细地描述他们经历过的某些特定情形。再问一些诸如个人成就与挑战、工作动机以及能给公司带来哪些改进之类的问题。面试官通常还会要求应聘者描述自己的个性,并解释为什么认为自己很适合所应聘的职位或公司文化,有时也会问应聘者的兴趣爱好。最后,应聘者通常有机会问面试官一些问题,面试官则会评估这些问题是否重要,以及应聘者是否有洞察力。

如果你的主要工作是负责招聘,那么你所用的甄选方法很可能就包含上述流程中的某些环节。一位组织心理学家指出:“很少有人可以不经过面试就被录用,这样的情况令人难以想象。”然而,几乎所有的专业人士在面试中做招聘决策时,都会在某种程度上依赖直觉性判断。

招聘面试的普遍性反映了人们的一种根深蒂固的观念,即在选择与我们共事之人时非常重视判断的价值。作为一项判断工作,人事选拔有个巨大的优势:由于它的广泛应用以及重要的作用,组织心理学家们对它进行了详尽的研究。1917年《应用心理学》(Journal of Applied Psychology)期刊的创刊号就将招聘确定为“首要问题……因为人的能力毕竟是一个国家最重要的资源”。一个世纪后,我们对各种人才选拔技术(包括标准面试)的有效性有了很多了解。没有任何一项复杂判断任务能得到如此之多的现场实验研究的关注。人事选择因此成为一个完美的测试案例,我们可以将从中获得的经验应用到包括多选项决策的很多判断任务中去。

面试的风险

如果你对求职面试的研究不熟悉,接下来的内容可能会让你大吃一惊。从本质上说,如果你的目标是确定哪些应聘者在工作中会成功,哪些会失败,那么标准面试并不能提供非常有用的信息。更直截了当地说,它们往往毫无用处。标准面试也被称作非结构化面试,它与结构化面试有所不同。我们很快会介绍结构化面试。

为了得出这一结论,无数研究人员考察了评估者在面试中给应聘者的高评分与应聘者最终取得工作上的成功之间的相关性。如果面试中的高评分与成功之间的相关性很高,那么面试或其他以相同方式计算相关性的招聘技巧,都可以被认为是候选人绩效良好的预测指标。

这里需要注意的是,“如何定义成功”是一个非常重要的问题。通常情况下,绩效是基于上级评估的评分而来。有时,工作年限也是衡量成功的标准。当然,这些衡量标准都有一些问题,特别是绩效评估的有效性值得怀疑,这一点我们在上一章中已经指出。然而,为了评估雇主在选择员工时所做判断的品质,使用同一雇主在评估其员工时所做的判断似乎是合理的。

那么,这些分析得出了什么结论呢?在第11章中,我们提到了传统面试的评分与工作绩效评分之间的相关系数是0.28。其他研究报告的相关系数为0.2~0.33。正如我们所看到的,按社会科学的标准,这体现出了很好的相关性。但是,要据此做决策,这一相关性就不算好了。使用我们在第三部分介绍的一致性比率,可以计算出一个概率:根据前面提到的相关水平,如果你对两个候选人的了解只限于一个候选人在面试中比另一个表现得好,那么这个候选人确实比另一个绩效更好的概率仅为56%~61%。这当然比掷硬币好一些,但是据此做出重要决策并不是一个稳妥的方法。

诚然,面试除了对候选人做出判断外,还有其他目的。尤其是,面试为公司提供了一个向候选人推销自己的机会,提供了一个与未来同事建立友好关系的机会。然而,从组织的视角来看,组织在人才选拔上投入了大量时间和精力,面试的最主要目的显然还是选拔。在这项任务上,面试做得并不成功。

面试中的噪声:面试官更倾向于与自己相似的求职者

我们很容易理解为什么传统面试在预测工作绩效时会产生误差。有些误差与我们所谓的客观无知(见第11章)有关。工作绩效取决于很多因素,包括你雇用的人适应新职位的速度,以及各种生活事件对其工作的影响。在招聘时,很多情况都是无法预测的。这种不确定性限制了面试的预测效度,事实上,也限制了任何其他人事选拔技巧的预测效度。

面试也是心理偏差的重灾区。近年来,人们已经意识到,面试官往往无意识地青睐那些与他们有相似的文化背景或共同之处的候选人,涉及的因素包括性别、种族和教育背景。许多公司现在已意识到偏差带来的风险,并试图通过对招聘专家和其他员工实施专项培训来应对这些风险。几十年来,其他一些偏差也逐渐为人们所知。例如,外貌在候选人评估中起着重要作用,即使是那些与外貌无关的职位也是如此。所有或者说绝大多数招聘人员都有这样的偏差,评定具体某个候选人时,如果外貌发挥了作用,招聘者们就会产生一个共同的误差,即在候选人评估中的正偏差或负偏差。

关于面试过程中也存在噪声这一事实,你应该不会感到惊讶:不同的面试官对同一个候选人的反应不同,得出的结论也不同。两位面试官对同一位应聘者的评分的相关系数为0.37~0.44(PC=62%~65%)。其中一个可能的原因是,应聘者在不同面试官面前的表现不一致。但即使是多位面试官同时面试同一位应聘者,前者对后者的表现给出评分的相关性也很低。据一项元分析估计,面试官们的评分相关系数仅为0.74(PC=76%)。这意味着,你和另一位面试官在同一场面试中对同样的两位候选人进行面试,最后仍然有1/4的可能性无法就哪位候选人更优秀达成一致。

这种差异很大程度上是模式噪声的产物,即面试官们对某位应聘者的特殊反应是有差异的。大多数组织在预料到了这种差异后,要求几位面试官面试同一位候选人,并将面试结果以某种方式汇总。通常,汇总意见是通过讨论形成的,在讨论中必须达成共识——正如我们在前文中看到的那样,这一过程本身会产生问题。

一个更令人惊讶的发现是,在面试中存在很多情境噪声。例如,强有力的证据表明,应聘者能否获得面试官的聘用推荐,与面试过程中非正式关系的建立阶段所形成的印象有关。该阶段就是面试刚开始的2~3分钟里,面试官与应聘者寒暄,从而让应聘者放松的阶段。因此第一印象非常重要。

也许你认为,凭第一印象做出判断没什么问题。至少我们从第一印象中了解到的一些东西是有意义的。众所周知,在与新朋友交流的最初几秒钟里,我们确实能了解到一些东西。对于有经验的面试官来说尤其如此。但面试的前几秒钟恰恰反映了你从第一印象中获得的表面特质:早期的认知主要基于应聘者的外向性和语言能力。即使是握手的感觉,也是能否获得面试官推荐的重要预测因素!我们可能都喜欢坚定的握手,但很少有招聘人员会有意识地将握手是否坚定作为关键的聘用标准。

面试官心理学:我们总是太相信“第一印象”

为什么第一印象会对面试的最终结果产生影响?其中一个原因是,在传统面试中,面试官可以自由地将面试引向他们认为合适的方向。他们很可能会问一些能证实第一印象的问题。如果某位应聘者显得害羞和矜持,面试官可能会问一些尖锐的问题,比如询问应聘者过去在团队中工作的经历,但他们可能不会向那些看起来开朗、合群的人问同样的问题。他们收集的这两位候选人的相关证据将不尽相同。一项研究考察了面试官基于应聘者的简历和能力测试成绩,形成了对该应聘者积极或消极的第一印象之后的行为。结果发现,第一印象对面试过程有重要的影响。例如,面试官形成了积极的第一印象后,面试时提出的问题就较少,而且往往会把公司“推销”给应聘者。

第一印象的作用并非面试中唯一有问题的因素。另一个因素是,作为面试官,我们希望面前的候选人表现得合乎情理(在第13章中我们讨论过,这是我们过度寻求一致性的一种表现)。在一个让人难以置信的实验中,研究人员让学生扮演面试官或应聘者的角色,并告诉他们,面试中只能提问封闭式的是非题。然后,他们让一部分应聘者随机地回答问题。按照事先安排好的方法,应聘者会根据问题的首字母来回答“是”或“否”。研究人员有些讽刺地指出:“一些应聘者最初担心随机答题会被人发现他们在胡说八道,从而导致面试进行不下去。但他们的担心是多余的,面试顺利地进行了下去。”你想得没错:没有一位面试官意识到,候选人在随机地给出答案。更糟糕的是,当询问面试官是否能“根据与面试者在一起的这段时间,推断出很多这个人的相关信息”时,得到应聘者随机回答的面试官与得到应聘者如实回答的面试官,在认为自己能做到这一点的概率方面数值差不多。这就是我们创造连贯性的能力。就像我们经常能在随机数据中找到一个想象的模式,或从云的轮廓中想象出一个形状一样,我们能够在完全没有意义的答案中找到逻辑。

还有一些不那么极端的情况,请看下面这个例子:我们中的一人不得不面试一位应聘者,这位应聘者之前是一家中型公司的首席财务官。面试官注意到这个应聘者入职了几个月后就离职了,于是问他为什么这样做。应聘者解释说,是因为“与CEO有战略分歧”。另一位同事也面试了这位应聘者,问了同样的问题,得到了同样的答案。然而,在随后的汇报中,两位面试官的观点却截然不同。其中一位之前就对该候选人形成了积极评价,因此认为候选人离开前公司的决定是正直勇敢的表现。而另一位面试官之前就形成了消极的第一印象,则把同样的事实解释为不灵活,甚至可能是不成熟的表现。这个故事说明,即使我们自认为对候选人的判断完全是以事实为依据的,我们对事实的解释都会受到先前态度的影响。

传统面试的局限性让我们严重怀疑能否从中得出有价值的结论。然而,面试中形成的印象是生动的,面试官通常对此充满信心。当把面试结论和候选人的其他线索结合起来时,我们往往会把面试看得太重,而把其他可能更具有预测性的数据,比如能力测试的成绩看得太轻。

面试的故事是情境噪声在实际生活中的一个例子。应聘教职的教授经常被要求为同行授课,以确保他们的教学技能达到学校的标准。这种授课当然不同于平常的正式授课。有人曾经目睹过一位候选人在这个试讲中给人留下了不好的印象,很明显是因为当时的压力过大,因为候选人的简历中提到了自己曾获得优秀的教学评价和几项优秀教学奖。然而,他在一个高度人为化的情境中的失败表现给人留下了深刻的印象,这种印象所占的决策权重,高于那些代表出色教学表现的抽象数据所占的决策权重。

还要记住,当面试不是唯一的候选人信息来源时,例如,还有能力测试、推荐制度或其他信息时,这些不同的信息必须汇总成一个整体性判断。这引发了一个问题,你现在应该能意识到这一问题:是应该使用判断(诊断性汇总)还是公式(机械性汇总)来汇总信息?正如我们在第9章中看到的,无论是预测一般性工作表现,还是预测具体情况中的工作表现,机械性方法都更好用。可惜,据调查显示,绝大多数人力资源专业人士都更赞成使用诊断性汇总。这种做法给已经充满噪声的面试过程增加了另一个噪声源。

通过结构化流程提升人事筛选品质

如果传统面试和基于判断的招聘决策只会产生有限的预测效度,那么我们该怎么办呢?幸好,研究还提出了一些关于如何改进人员选拔的建议,有一些公司正在关注这些建议。

谷歌就是这样的一个例子。它改进了人员选拔措施并报告了改进的结果。拉斯洛·博克(Laszlo Bock)曾任人力运营部高级副总裁,他在《重新定义团队》(Work Rules!)一书中讲述了这些事情。尽管谷歌专注于招聘最优秀的人才,并投入大量资源寻找合适的人选,但其仍举步维艰。对招聘面试的预测效度进行审查后发现“相关度为0……完全随机得一团糟”。谷歌为解决这一问题所做的变革,体现了近几十年来研究中提出的一些原则。这些变革措施也是决策卫生策略的例子。

其中一个策略是汇总,你应该已经很熟悉它了。人们在这种背景下使用汇总并不奇怪。几乎所有公司都会汇总多个面试官对同一个候选人的评价。谷歌也不甘落后,有时会让求职者参加25轮面试!博克得出的结论之一是面试次数应该减少到4次,因为他发现在4次面试的基础上再增加额外的面试几乎不会提升预测效度。不过为了确保预测效度,谷歌严格执行了一项规定:公司要确保面试官在相互交流之前对候选人进行独立打分。这条规定并不是所有公司都有。谷歌相信:汇总是有效的,前提是判断是独立的。

谷歌还采用了一种我们尚未详述的决策卫生策略:将复杂的判断结构化。结构化一词可以有很多意义。此处使用这个术语时,我们按照3个原则来定义结构化的复杂判断:分解、独立性和推迟整体性判断(delayed holistic judgment)。

第一个原则是分解,它将决策分解为多个组成部分,每个部分对应一个中介评估法。这一步的目的与指南中确定子判断的目的相同:它能确保判断者将注意力集中在重要的线索上。分解就好像一个路线图,指明了需要什么样的数据,并且过滤掉不相关的信息。

以谷歌为例,人事决策可以分解成4个中介评估法:一般性认知能力、领导力、文化契合度(称为“谷歌特质”)和角色相关知识。某些评估会被分解成更小的成分。注意,应聘者的良好外表、流畅的表达、令人兴奋的爱好,以及招聘人员在非结构化面试中可能会注意到的任何其他方面,无论是积极的还是消极的,都不在该列表上。

为招聘任务创建这种评估体系似乎是人们的共识。事实上,如果你正在招聘一名初级会计或行政助理,职位描述中就明确规定了所需的能力。然而,专业招聘人员都知道,对于非常规职位或高级职位来说,对核心评估维度进行定义会很困难,而且定义这一步骤经常被忽视。一位知名的猎头指出,以一种足够具体的方式定义所需能力是一项富有挑战且经常被忽视的任务。他强调了“在问题的定义方面有所投入”对决策者的重要性:与任何候选人会面之前,都有必要提前花一些时间,就那些清晰且详细的职位描述达成一致。这里的挑战是,许多面试官使用的是经过协商或妥协而产生的浮夸的职位描述。这些描述只是一份模糊的清单,列出了一位理想候选人应该具备的所有特征,没有提供如何对这些特征进行调整或在不同特征之间进行权衡和取舍的方法。

结构化判断的第二个原则是独立性,要求独立收集每个评估维度的信息。只列出职位描述的组成部分是不够的:大多数进行传统面试的招聘人员也知道他们要在应聘者身上寻找的四五种能力。问题在于,他们没有在面试过程中单独评估这些因素。每个评估维度都会互相影响,这使得每个评估都充满噪声。

为了克服这一问题,谷歌精心安排了各种方法,以确保评估以事实为基础且相互独立。最明显的举措或许就是引入了结构化的行为面试(structured behavioral interviews)。在这种面试中,面试官的任务不是去决定他们是否喜欢某个候选人,而是收集评估结构中每个评估维度的相关数据,并在每个评估维度上为候选人打分。为此,面试官必须询问候选人在过去的某些情况下的行为,这些问题都是预先设定好的。面试官还必须记录答案,并参照一个预先制定好的评分量表,使用统一的评分标准进行评分。对于每一个问题,评分标准会就一般性答案、好答案或很好的答案给出具体的示例说明。这种标准统一的量表有助于减少判断中的噪声。我们在前一章中介绍的行为锚定评估量表也是它的一个例子。

这种方法听起来不同于传统的聊天式面试,事实也确实如此。这实际上更像是一场考试或审问,而不是一次商业会面。有证据表明,应聘者和面试官都不喜欢结构化面试,或者说,至少更喜欢非结构化面试。究竟什么样的面试才算得上结构化面试,针对这一问题的讨论仍在继续。尽管如此,有关面试的文献研究得出了一个一致的结论:结构化面试比传统的非结构化面试更能预测应聘者未来的表现,结构化面试与工作绩效的相关系数为0.44~0.57。用我们的PC指标来说,你通过结构化面试挑选出更优候选人的概率为65%~69%,明显高于非结构化面试56%~61%的概率。

谷歌在它所关心的一些维度上也使用了其他一些数据作为信息。为了测试与工作相关的知识,谷歌会依赖一部分工作样本测试(work sample tests),比如让应聘者编写几段代码。研究表明,工作样本测试是工作绩效的最佳预测指标之一。谷歌也使用“关系户推荐制”,但推荐人并不是由候选人本人指定,而是由与候选人有交集的谷歌员工指定。

结构化判断的第三个原则是推迟整体性判断,简单概括来说就是:不排除直觉,但推迟直觉。在谷歌,最终的招聘推荐是由招聘委员会共同做出的,该委员会审查候选人的完整资料,包括每次面试中每个评估维度上的评分,以及支持这些评估的其他相关信息。然后,委员会根据这些信息决定是否聘用候选人。

尽管这是一家以数据驱动文化著称的公司,尽管有证据表明机械性汇总数据比诊断性汇总数据更有效,但最终的招聘决策并不是机械性的,它仍然是一个判断。在这个过程中,委员会成员会考虑所有的证据,并对其进行整体权衡,以此来讨论这个人是否会在谷歌取得成功。这个决策不仅仅是计算得出的。

在下一章,我们会解释为什么我们认为用这种方法做出最终决策是明智的。但要注意,虽然决策不是机械性的,但谷歌最终会依据4位面试官给出的平均分做出招聘决策。他们也了解其他一些相关的证据。换句话说,只有在收集和分析了所有证据之后,谷歌才允许决策过程中存在判断和直觉。因此,每个面试官和招聘委员会成员快速形成直观印象并急于做出判断的倾向都得到了控制。

再重述一遍,分解、独立性和推迟整体性判断这三个原则,并不一定能为所有试图改进人事选拔过程的组织提供一个模板。但这些原则与组织心理学家多年来提出的建议基本一致。事实上,这些原则与本书作者卡尼曼于1956年在以色列军队中实施的一些选拔方法有相似之处,并且在《思考,快与慢》一书中有所描述。该选拔过程,就像谷歌公司使用的选拔流程一样,正式建立了一个评估结构——需要评估的性格和能力维度的列表。它要求面试官依次列出与每个维度相关的客观证据,并在评估下一个维度之前对该维度进行评分。并且,它允许招聘人员在进行结构化评估之后再运用判断和直觉做出最终决策。

有不可辩驳的证据表明,结构化的判断过程,包括结构化面试,在招聘中具有优越性。它能为采用这一方法的高管们提供实用性的建议和指导。正如谷歌的例子以及其他研究人员指出的那样,结构化的判断方法成本会更低,因为会面十分耗费时间。

尽管如此,大多数高管仍然相信非正式的、基于面试的方法具有不可替代的价值。值得注意的是,许多应聘者也相信只有通过面对面的面试,他们才能向未来的雇主展示自己真正的实力。研究人员称之为“错觉的持续”。很显然,招聘人员和应聘者都严重低估了招聘判断中的噪声。