Local EPUB Text
第十九章 保持简单,保持愚蠢
JZTZDSXHXYZ-25
第十九章 保持简单,保持愚蠢
我们总是花费太多时间去探究越来越多的东西,而得到的却越来越少,直到我们最终发现,我们所知道的一切都毫无价值。我们很少(如果有的话),停下来问自己:我们到底需要知道什么!
● 我们的行业一向痴迷于细枝末节。分析师十分惧怕说出“我不知道”。我个人从未有过这种顾虑!人们认为要想做出正确的决定需要知晓海量信息,但这其实是一种普遍存在的误解。事实并非如此。
● 蔡等人在一篇论文中展示了对预测比赛结果的美国橄榄球球迷的信心和准确度的研究结果。他们发现,人们在知晓6项信息时的预测准确率和他们知晓30项信息时一样高!然而,随着信息量的增加,信心却大幅增加(信心在所有层级的信息条件下都比准确性要高)。
● 处理大量信息能力的缺失反映了我们大脑中存在的认知局限。事实很简单,我们的大脑并不是拥有无限计算能力的超级计算机。与其盲目地挑战自己的认知极限,倒不如设法利用我们的自然禀赋。因此,我们不应该总是忙于收集无穷无尽的信息,而应该花更多的精力去找出真正重要的因素,并专注于此。
● 就信息超载问题而言,医疗领域和投资领域情况相似。例如,在密歇根州的一家医院中,医生把大约90%的严重胸痛病人都送进了重病监护室,事实上,他们将90%应该被送入重症监护室的病人和90%不应被送入重症监护室的病人都送进了重症监护室!他们的做法简直像是随机而为。
● 造成这一现象的主要原因似乎是医生们关注了错误的信息——实际上,他们关注的是一系列宽泛的“风险因素”,如年龄、性别、体重、吸烟史等。这些因素虽然有助于界定患心脏病的概率,但它们并不是诊断就医者是否真的患有心脏病的良好工具。
● 医院采用一套复杂的统计表来帮助医生做出更好的决策。然而,当这一辅助工具被移除后,医生们仍然可以做出良好的决策。原因是他们已经学会了如何利用关键信息来做出最好的诊断,他们能够运用决策树图来做出最佳抉择。类似的机制同样适用于投资领域。就如沃伦·巴菲特所说,“投资很简单,但并不容易”。
年初,我在一家客户公司就行为决策进行了长达两个小时的问答会议。会议结束时,主办人把我送了出来,并对我说:“如果让你选一个词来概括今天所讲的内容,你会选哪个?”我的回答是“简化”。
我以前写过关于知识幻觉的文章1,并且在我表达这一观点时,我花了相当多的时间谈论一个问题,我们总是花费太多时间运探究越来越多的东西,而得到的却越来越少,直到我们最终发现,我们所知道的一切都毫无价值。但我们很少停下来去问自己:在做实际投资决策时,我到底需要知道什么?
过去我经常使用保罗·斯洛维奇的研究来说明一个观点,即更多的信息并不一定是更好的信息。斯洛维奇的研究成果发表于1973年。为了确保这一结论的说服力,我要引用三位学者近期的学术成果来进行说明,他们的成果再次验证了斯洛维奇的结论。
越多越好吗
蔡等人在2008年再次表明,在达到最低界限之后,更多的信息会转化为过度的自信和静止的准确性。他们测试了美国球迷预测15场全国大学体育联盟橄榄球比赛的结果和分差的能力。这些信息(是通过调查未参与测试的球迷选出的)在五轮比赛中随机呈现。每一轮都显示六项信息(称作“提示”)。
所提供的信息故意隐去了球队名称,因为这些名称太具有指向性。取而代之的是大量统计数据,如己方接球失误、边际失误次数和推进码数。
受试者是来自芝加哥大学的30名本科生和研究生。他们平均花大约一个小时完成实验,以换取15美元的固定报酬。此外,研究人员承诺将奖励表现最佳的受试者50美元。为了参与这项研究,受试者必须通过一项测试,以证明自己足够了解大学橄榄球联赛。
为了从基准的角度来研究“更多的信息是否是更好的信息”这一问题,我们对实际测试中没有使用的比赛进行了逐步的逻辑回归。虽然这听起来非常复杂,但它真正的意思是每一轮都向计算机模型中加入新的信息,从而模拟受试者所面临的情况。
结果如图19-1所示,当仅有第一轮信息(6条提示)时,该模型的准确率约为56%。之后信息逐步添加,当所有可用信息都呈现出来时,预测精度提高到71%。
因此,从统计模型的角度来看,更多的信息确实意味着更好的信息。然而,当把计算机替换成人时,结果产生了巨大的差异。图19-2展示了受试者的平均表现。无论所提供的信息量有多大,人所预测结果的准确率一直在62%左右。在最初几轮,受试者的预测准确度高于计算机模型(尽管在统计意义上并不显著),在后几轮中,前者的准确度不如后者。
然而,随着信息的增加,受试者的信心往往会飙升。当受试者有6条提示时,他们的信心度是69%,而当受试者有30条提示时,他们的信心度上升到了80%。因此,就像斯洛维奇最初的研究一样,随着可用信息的数量而增加的是信心,而不是准确性。
这一发现反映了人类大脑的认知局限。早在1956年,乔治·米勒就曾发现,人类的平均工作记忆可以处理7位数的信息(有正负2位数的浮动)。
早在乔治·米勒发现这一认知局限之前,阿瑟·柯南·道尔爵士就已经借夏洛克·福尔摩斯之口表达过类似的见解:
我认为人的大脑原本就像是一间空空的小阁楼,应该有选择地把一些家具放进去。愚蠢的人把他碰到的各种各样的破烂杂碎一股脑儿装进去。这样一来,那些对他有用的知识反而被挤了出来;或者和许多其他的东西掺混在一起,那么他在需要取用这些信息时便很难找到它们。一个会工作的人,在选择要把一些东西装进他的那间小阁楼似的头脑中去的时候,他一定是非常仔细小心的。除了工作中有用的工具以外,他什么也不带进去,而这些工具又样样具备,摆放得有条有理。如果你认为这个小房间的墙是有弹性的,并且可以任意扩张,那就大错特错了。毫无疑问,总会有那么一天,你每增加一点儿新知识,就会忘记一些你以前知道的东西。因此,最重要的是不要让无用的信息排挤掉有用的信息。
《血字的研究》
归根结底,我们并不是拥有无限能力的超级计算机。与其试图挑战大脑的认知极限,倒不如好好利用我们与生俱来的自然禀赋。因此,我们不必无穷无尽地收集信息,而应该花更多的时间去找出什么才是真正重要的,并专注于此。
KISS法则:保持简单,保持愚蠢
狄克斯特霍伊斯等人在2006年的一项研究为人类智能有限这一观点提供了更多的证据。在他们的研究中,受试者被告知需要在4种不同的汽车中选出最好的汽车。他们面临着两种情况:一种是只能获取每辆车的4个性能(低信息承载量),另一种是能获取每辆车的12个性能(高信息承载量)。在这两种情况下,有一款车明显“好”于其他的车,它拥有75%的正面性能;另两款车有50%的正面性能,而剩余的一款车只有25%的正面性能。
图19-3显示了在两种信息条件下受试者选择“最佳”汽车的占比。在低信息承载量的情况下,近60%的受试者选择了正面性能最多的汽车。然而,在高信息承载量的情况下,只有20%左右的受试者选择了正面性能最多的汽车!
心脏病的教训
李·格林在这一领域做了最初的研究,并将成果发表在他与耶茨在1995年合著的论文中。在密歇根州的一家医院里,医生们想要把90%胸痛严重的病人送到重症监控室。因此,重症监控室变得异常拥挤,医护水准不断下降,而费用却不断攀升。
把众多病人送进重症监护室的决定反映了医生们对假阴性(即没有让本应进入重症监控室的人进入)代价的担忧。你可能会说,把不该送的送进去总比该送的没送强。然而,这其实忽略了进入重症监护室固有的风险。每年大约有2万美国人死于医院内的交叉感染,而在重症监护室中感染此类疾病的风险明显高于常规病房。
就密歇根州医院的医生而言,他们最严重的问题是,把大约90%的应被送进重症监护室的病人和90%不应被送进重症监护室的病人都送进了重症监护室。他们的做法简直像是随机而为!
为什么
上述现象引出了这样一个问题:为什么医生们很难把需要特殊医护的病人和不需要特殊医护的病人区分开呢?格林和耶茨对这个问题进行了研究。
研究发现,医生在进行诊断时总是在关注错误信息。他们过度关注如家族病史、年龄、性别、吸烟史、糖尿病、高胆固醇和高血压等“危险因素”。
然而,尽管这些因素对评估某人患心肌缺血的总体可能性有所帮助,但它们却不能作为诊断依据。这些因素不是有效的信息线索,格林和耶茨将其描述为“伪诊断项”。也就是说,“这些因素只是一些与诊断相关的附加信息,它们会影响到确诊的概率,但在分辨是否确诊时不具备客观价值”。
研究表明,我们有更好的诊断线索——患者症状的性质和位置、缺血性疾病的病史以及某些特定的心电图,这些才是迄今为止对心脏急性缺血、梗死和死亡最有力的预测因素。
有什么办法吗
格林和他的同事们想出了一个主意,用卡片标记各种诊断信息及其对应概率。然后,医生可以根据症状和检测结果将概率相乘,从而估计出就医者的患病概率。如果这个值高于设定的阈值,那么病人就会被送进重症监护室,否则送进常规监护病房就足够了。
在这种方法被引入临床诊断之后,医生的决策水平有了明显的提高。尽管医生误诊的比例还是很高,但他们把不需要送去重症监护室的病人送到重症监护室的概率却大大降低了。
这可能表明这种卡片是奏效的。但是,作为优秀而严谨的科学家,格林等人决定对这一结果进行检验以确保情况确实如此。检验方法是,在几周内给参与实验的医生发放诊断卡片,另处几周不发放。显然,如果诊断卡片是使医生诊断质量得以改善的原因,那么在卡片被禁用的几周里,医生的诊断质量应该有所下降。
实验的结果令人惊讶。不管是否使用了卡片,医生的诊断似乎都得到了改善!这一惊人结果到底是由什么造成的呢?有没有可能是医生已经记住了这些卡片上的概率,并且在没有卡片的情况下他们仍然在使用概率相乘的方法?
这似乎不太可能,因为要记住卡片上标出的各种排列组合不是件容易的事。通过一项简捷的测试,研究人员发现了原因所在。事实上,医生们已经学会了如何抓住诊断的正确线索。通过向他们展示正确的诊断项目,医生关注的重点已经从伪诊断信息转向真正有用的信息元素。他们开始步入正轨了!
简单是关键
基于这一经验,格林和梅尔在1997年设计了一个简单易用的决策树,即一系列判断正误题(比最初构建的基于概率进行诊断度量的方法要容易几个数量级)。该决策树的结构如图19-4所示。
如果病人表现出一种特殊的心电图异常(ST段改变),他就会被立即送入重症监护室。如果未见异常,则将第二种判断元素纳入考虑之中:患者是否存在胸部疼痛。如果他确有此症状,那么他就被送入重症监护室,以此类推。
这种方法使医生对诊断决策的关键因素一目了然,并且在实践中也颇具成效。图19-5显示了我们所讨论过的各种方法的诊断准确性情况。坐标轴代表我们所研究的问题的两个维度,即被正确诊断并被送进相应病房的患者比例(纵轴)和被错误诊断并被送入错误病房的患者比例(横轴)。
45度角斜线代表纯靠运气。该线以上的点代表诊断质量好于随机决策,而该线以下的点则代表诊断质量还不如全凭运气。
医生最初的表现要略逊于随机决策。尽管复杂的概率模型可以生成多种诊断方案,但我选取了其中的最优方案,以确保心脏病患者被正确诊断的比例最高。该模型显著提高了医生的个人诊断能力;它有效提高了心脏病患者的确诊率,并大幅减少了被误判为需要送入重症监护室的人数。
然而,简单的决策树的效果则更好。它的应用使正确诊断率变得更高,并且被误判为需要送入重症监护室的人数减少得更多!由此可见,简单快捷的决策在这个领域是卓有成效的。
高手专注于关键信息
值得注意的是,雷纳和劳埃德在2006年对不同层次医生的心脏病诊断情况进行了研究。他们得出的结论是,医生的专业水平越高,他们做出准确决策所需要的信息就越少。专家们基本上只关注最关键的信息,不允许自己为无关的信息分神。
图19-6突出显示了各层次医生判断是否送重症监护室时,参考心肌梗死(MI)及冠心病(CAD)的相关系数。医学院学生的诊断决策同时受心肌梗死和冠心病二者影响。事实上,这种模式一直持续到心脏病医师的水平才结束。作为医术水平最高的群体,心脏病学专家只关注心肌梗死风险。这一发现再次表明,我们需要关注关键信息,而不是沉迷于去获取更多的信息。
从急诊室到市场
让我们再回到投资领域。是否可以借鉴医疗领域的决策树模型来为投资者设计一种决策模型呢?理查德·塞勒(行为金融学奠基人之一)将这种工具称为“决策结构图”,其基本目的是通过调整偏差而非去除偏差来帮助人们做出优质决策。我经常敦促投资者去思考投资中真正重要的因素,其实人们很容易就能想象出一个简单易用的决策树(如图19-7所示),它可以帮助投资者专注于真正关键的信息。
投资者最好记住沃伦·巴菲特的那句至理名言:“投资很简单,但并不容易!”
1 见《行为投资学》第二章、第十一章。——作者注