Local EPUB Text
第三章 伪科学和金融:数字的暴政和安全的谬论
JZTZDSXHXYZ-7
第三章 伪科学和金融:数字的暴政和安全的谬论
在现代金融界,对数字的热爱取代了对批判性思维的渴望。任何能与数字联系到一起的理论都会被奉为真理。研究表明,人们经常被伪科学愚弄。一件事被弄得越复杂,越容易让人信以为真!风险管理者、分析师和咨询师都在利用伪科学来制造安全假象。我们要对那些刻意部署的、毫无意义的数字提高警惕。批判性思维和怀疑主义是我们这个世界上最未被重视的(也是最稀缺的)工具。
● 韦斯伯格等人的一项研究揭示了我们大多数人是多么容易被任何听起来貌似科学的东西愚弄。他们在解释标准心理学中的各类偏见时加入了神经科学专业术语。这些解释有些是“好的”(真实的),有些则是“坏的”(对现象本身的循环重申)。结果是,人们倾向于给那些包含无意义神经科学专业术语的解释更高的评价,不管它们实际上是“好”是“坏”。
● 加纳等人已经证明,人们很容易因为“诱人的细节”而分神。在读了几段“有趣”但与主题不相关的信息后,人们根本无法回忆起重要的内容!突然之间,我开始对分析师的世界有了一些认识!
● 金融充斥着伪科学和诱人的细节。例如,风险管理显然是最高层次的伪科学。风险价值模型(VaR)令人觉得舒适,但实际上它仅仅创造了安全错觉。肥尾的存在、内生性和使用拖尾型输入的风险共同导致了VaR的无效。瑞银(UBS)所犯的“最大错误”无疑是其对VaR的过度依赖,这也是其核心问题之一。
● 分析师们也犯下了使用伪科学的罪行。他们是诱人细节的提供者。当阅读大多数分析师的报告时,你会发现这些报告充满了“有趣”但不相关的信息。他们能预测未来5年的回报,并将其精确到小数点后两位,这无疑是很可笑的。这样做毫无益处。在最新发布的财报中,我们发现了有史以来对利润增长的最大高估!
● 业绩衡量指标是伪科学在金融领域盛行的另一个例子。像阿尔法、贝塔和追踪误差等遁词在这一领域的使用引发了诸多困惑。对风格漂移、基于所持股票的风格分析和基于回报的风格分析的使用让业绩衡量指标在金融行业中听起来似乎举足轻重,但当我们去追溯这些数字背后的含义时,我们会发现,这一切都存在严重的缺陷。
● 某种东西可以被量化并不意味着它就是合理的。没有什么能代替严谨的批判或怀疑思维。盲目信仰“因数字而数字”的投资者会走向毁灭。
在现代金融界,对数字的热爱取代了对批判性思维的渴望。这一趋势非常令人遗憾。请别误解我的意思,我非常喜欢用实证证据来证实在我们这个行业中所流传的许多狂言妄语的真实性(我将这个过程称为基于实证的投资)。然而,我们似乎常常把伪科学当作真理,将任何带有数字的东西都看作事实。
伪科学会蒙蔽你的双眼
韦斯伯格等人2008年的一项研究揭示了一些有趣的发现——伪科学蒙蔽人们的方式,以及伪科学的解释轻而易举就能使人们上当受骗。
韦斯伯格等人设计了一个精妙的实验,他们为三组受测对象(对神经科学一无所知的学生、神经科学专业的学生和神经科学专家)提供了一些对不同心理学现象的解释,这些解释在两个维度上有所不同:(i)解释的质量(ii)神经科学专业术语的运用。
表3-1展示了对“知识的诅咒”这一现象的四种样本解释。在所有实验过程中,“好的”解释是研究人员给出的真实解释。“坏的”解释只是对现象的循环重述,根本不含任何解释成分。
在遇到包含神经科学专业术语的解释时,大脑中负责处理此类一般现象的区域中的信息便被插入进来。然而,由于这些信息是已知的,所以参与者对该解释的有效认知不应该受其影响。
研究人员要求参与者给这些现象的解释打分,并告知他们,在某些情况下,他们会读到错误的解释。他们对这些解释的评分范围在-3 (令人非常不满意的解释)和+ 3 (令人非常满意的解释)之间。
图3-1至图3-3分别显示了三组不同的结果。在不含神经科学专业术语的解释中,第一组的新手们(他们没有接受过任何心理学或神经科学训练)很好地区分了“好的”解释和“坏的”解释(图3-1)。然而,他们在区分那些含有神经科学专业术语的解释是“好的”还是“坏的”方面的能力却明显不足。他们给那些含有神经科学专业术语的“坏的”解释的评分要比给那些不含任何神经科学专业术语的“坏的”解释的评分高得多。
第二组由学习过中级认知神经科学课程的学生组成。这些学生应该已经了解神经科学实验的基本逻辑和构造。然而,从图3-2可以看出,他们的回答与新手组并无明显差别。他们似乎很看重神经科学专业术语,并且给那些不含这些专业术语的“好的”解释的打分很低。神经科学专业术语的出现,再次拉高了“坏的”解释的得分。这些学生似乎只对他们所学的东西感兴趣。
第三组是专家组——他们在认知神经科学或认知心理学领域拥有高等学历。该组参与者的行为表现与前两组尤为不同。如图3-3所示,在不含神经科学专业术语的解释中,该组参与者很好地区分了“好的”解释和“坏的”解释。此外,当面对含有不必要的神经科学专业术语的解释时,这组参与者给“好的”解释打了偏低的分数,以作为对加入那些冗余的专业术语的有效惩罚。这一结果证明,神经科学专业术语本身毫无价值。
看电视会提高你的数学能力
我们可以从麦凯布和卡斯特尔在2008年发表的研究成果中找到另一个伪科学蒙蔽我们的例子。他们让参与者读了三篇短文,每一篇都是对虚拟脑成像研究结果的总结。这些文章提出的论断并没有数据支持,因此参与者可以基于自己的判断对这些论断的合理性持怀疑态度。
一篇文章提出“看电视和数学能力有关”。研究得到的结论是,因为看电视和完成算术题都能激活颞叶,所以看电视能提高数学技能。这种激活的相似性被分别以柱形图、脑部成像图以及纯文字的形式展现出来,每种形式一页,图片被嵌入其中,成为三篇短文,每篇大约300字。
在每读完一篇短文后,参与者被要求评价其中的科学推理是否有道理。回答分为四个等级,包括“非常不同意”“不同意”“同意”和“非常同意”(分值分别为1、 2、 3和4)。
图3-4显示了三种不同展现形式的得分情况。参与者再一次被脑部成像图的存在愚弄了。研究表明,参与者对含有这样一张图片的短文的评价是“听起来要科学得多”!
诱人的细节
总的来说,这些发现可以被归到一个更大的范畴,即“诱人的细节”。在1989年的一篇论文中,鲁斯·加纳和他的同事们首次注意到,人们经常因“有趣”但“不含信息”的噪音而分心。在他们的实验中,参与者被要求阅读三段文字,比如:
有些昆虫是独居的,有些则是群居的。独居的黄蜂被称为独居黄蜂。泥蜂是一种独居的黄蜂。叩头虫也是独居的。当一只叩头虫仰面朝天的时候,它会腾空而起,翻转过来,同时发出“咔哒”一声噪音。蚂蚁则是群居的。
很明显,重要的信息在第一句话。叩头虫的故事很有趣,但并不重要。一些参与者阅读的段落只包含重要的信息,其他一些参与者阅读的段落和上述段落相似。
阅读完这些段落后,参与者被要求回忆他们阅读过的文章中所包含的重要信息。回忆重要信息的能力在很大程度上取决于这段话是否包含了诱人的细节。在那些阅读段落只包含重要事实的参与者中, 93%的参与者能够回忆起重要的概述。而在那些阅读了含有诱人细节的段落的参与者中,只有43%的参与者能够回忆起重要的元素!
在金融领域的应用
风险管理
多年来,我一直都在直言不讳地批评风险管理(请参阅《行为投资学》第三十六章)。这是证明我们被数字蒙蔽的最好例子。用数字来量化风险的大小固然是一件让人觉得很惬意的事情,但也几乎毫无意义。认为数字绝不会错的错误信念创造了安全错觉。
风险价值模型(VaR)在本质上是有缺陷的——毕竟它切断了我们真正感兴趣的部分:尾部!这就好比我们买了一辆装有安全气囊的汽车,卖家做出承诺说,除非发生车祸,否则安全气囊肯定能正常工作。人们忽略了这样一个事实:就诸多金融事务而言,风险是内生的,而非外生的(关于这一点以及对VaR方法中包含的错误的全面分析,请参阅《行为投资学》第三十六章)。整个风险管理行业就是一个伪科学的例子:人们假装去测量和量化一些根本无法被测量或量化的东西。
最近,我最为钟爱的关于风险价值模型无效的分析来自大卫·艾因霍恩在2008年的一次演讲:
通过忽略尾部,风险价值创造了一种让人们愿意去承担巨大但遥远的风险的动机。让我们用抛硬币来类比投资。如果你下注100美元赌硬币出现背面向上的次数为偶数,那么在99%的置信区间内,你的风险价值是100美元。由于你输掉这100美元的概率为50%,这显然在阈值之内。在这种情况下,风险价值将等同于最大损失。
与此相比,如果你用这100美元以217比1的赔率下注,赌正面朝上的情况不会连续出现7次,你赢的概率超过99.2%,超过了99%的阈值。因此,即使你可能会损失21,700美元,你在99%置信区间内的风险价值仍是0美元。换言之,投资银行不需要提供任何资金就可以下这个赌注。
基于上述分析,以下事实就不难理解了:最近,瑞银公布的承认自己所犯错误的列表(请参阅《关于瑞银资产减记的瑞银股东报告》)中再一次囊括了其对VaR的使用:
过度依赖时间序列:用于驱动风险价值和压力测试1的历史时间序列是基于五年的数据,但这些数据都取自相对积极的增长时期。而相关时期的日常工作重点是在全面经济发展和历史有利条件的基础上去确认现有方法的有效性。事后看来,尽管集团和IB高层已经收到了对方法论进行更新的建议,但这些调整建议并没有对美国住房市场(尤其是次贷市场)的显著增长给予足够的重视。市场风险函数没有根据美国住房市场更为本质的属性来进行调整。
缺乏住房市场风险因素损失限制:与此同时,公司没有试图去设立一种风险因素损失(RFL)控制结构,以从总体上去捕捉关于美国住房市场更有意义的属性(如违约、贷款价值比率或其他与之相类似的会对现有投资组合产生统计意义上的冲击的属性)。
过度依赖风险价值和压力测试:尽管美国抵押贷款市场的拖欠率一直在上升,贷款发放标准却一直在下降。在此背景下,市场风险委员会(MRC)仍在依赖风险价值和压力测试的那些数字进行审时度势。在次贷资产头寸大量累积的过程中, MRC一直如此行事,并仅进行了部分对冲。在MRC的代表向瑞银高层提交的报告中,瑞银在各种业务中所持有的次贷头寸并未被充分提及。该报告亦未向集团高层发出任何警示,说明报告中所提供的数字具有局限性,或提及有必要在更广泛的背景框架下对其研究结果进行进一步检验,否则该研究结果经不起推敲。
肥尾的存在、内生性和拖尾型输入的风险多年来一直为人们所知晓。然而,尽管如此,人们还是一直在使用这些方法,并且认为聊胜于无。然而,对于病人来说,有药真的比没药要好吗?药不对症可能会危及生命。这种对伪科学的盲目信仰会再次使人们付出高昂的代价。
分析师和他们对数字的执念
然而,犯下制造伪科学罪行的并非只有风险经理。分析师也在其列。他们是诱人细节的提供者。他们能预测出未来5年的回报率并将其精确到小数点后两位,这无疑是很可笑的。别忘了,在华尔街工作的约2000名分析师们在2008年就向我们展示过其骇人的预测能力。
2007年第三季度伊始,美国企业的平均收益率据预测将增长5.7%。截至第三季度末,分析师将这一预期增长率降至2.7%,削减了原来的一半以上。但财报显示,公司的平均利润最终下降了2.5%。分析师们的预测结果比实际高了8.2个百分点!
分析师们对第四季度的预测甚至更糟。据分析师预测,利润增长率将达到10.9%,之后他们又急速将其下调至-7.9%。最终,据财报显示,标普500指数成分股公司的平均利润下降了22.6%,这意味着分析师们预测的利润增长率与实际增长率之间相差了33.5个百分点,这是有史以来发生的最大失误(图3-5)。
当然,不要担心,分析师说,到2008年下半年一切都会好起来。他们预测2008年第一季度和第二季度的收益将分别下降11.3%和3.5%,但随后会出现复苏——第三季度将增长13.9%,第四季度的增长率将跃升至54.5%!
客户真的会认为这种无用的噪音是有价值的吗?当然不会。但每当分析师被问及为何要坚持制造这种垃圾时,他们的回答总是一成不变——他们的客户想要。难道真的是买方钟情于这些伪科学及其诱人的细节吗?
在与买方交流后,我发现事实并非如此。与我交谈过的基金经理们通常会忽略分析师们在预测方面制造的毫无意义的噪音,他们更愿意关注那些正做着不同的事情的分析师。但也有可能我的样本有失偏颇!
实际上,在刚刚完稿之时,我偶然发现了阿什顿合伙公司的布莱恩·阿姆斯特朗的一项研究。他试图去探索卖方的预期对于买方机构的重要性。30位投资组合经理参与了该调查研究,他们均表示,普遍预期(图3-6)对他们的投资决策过程是重要的!现在我真的开始担心了。
业绩衡量指标也是伪科学
我想在本章中讨论的对伪科学的最后一个应用是业绩衡量指标。这无疑是迷信一个数字(或最多几个数字)的另一个例子。阿尔法、贝塔和追踪误差在这场表演中被用作推销伪科学的花言巧语(请参阅本书第二章中对CAPM进行反驳的内容)。
积极型基金经理使用诸如追踪误差之类的指标,就像是被送上拳击场的拳击手得到的指示是要确保自己的比分与对手相差一到两分以内,而不是赢得比赛。
最近,当我读到约翰·米纳汉2009年发表的关于“投资信念”的一篇耐人寻味的论文时,我意识到了业绩衡量指标伪科学本质的另外一面。他描述了以下情形:
我是这个行业的新手……一位基金经理引起了我的注意,因为她的持仓风格从价值型转变为成长型,这敲响了“风格原则”的警钟。该基金经理业绩表现良好,这发生在成长型股票的表现优于价值型股票的时期,所以从表面来看,该基金经理之所以抛弃价值投资理念,是因为成长型股票的回报更高。
我在对其投资组合进行仔细研究后发现,该基金经理在这段时间内的换手率非常低。当该经理买进那些股票时,它们已由成长型变为价值型。事实上,该基金经理对这些股票中大多数的判断都是正确的:收益上升了,价格则上升得更多,故这些股票被归为了成长型股票。无论我问及哪只股票,她都能用自己最初的投资理念对其进行解释;对于那些她仍然持有的股票,她可以证明自己完全遵循了同一投资理念。这令我对我所使用的风格划分机制产生了怀疑,是不是这种划分并没有精巧到可以捕捉该基金经理的风格?而她的投资风格在这段时间内实际上是一致的。
当我与一位资深顾问讨论我的担忧时,他驳回了我的解释。他声称,风格分析者是“客观的”,而基金经理的解释却是“主观的”。他还告诉我,在积累了更多经验后,我将会对那些有魅力的基金经理(成长型基金经理)更加心存怀疑。
这位资深顾问显然迷信了伪科学。某样事物可以被量化,并不意味着它就是绝对正确的。我们仍然需要批判性思维。米纳汉的分析很可能是正确的。事实上,法玛和弗兰奇在2007年已经表明,大部分价值溢价都来自那些有效跨越“风格界限”的股票(见表3-2)。
结论
作为金融实证方法的拥护者,在金融领域遇到伪科学令我感到难过。然而,这却屡见不鲜。对数字的盲目信奉业已侵蚀我们的行业。若想避免陷入伪科学在金融领域布下的诱人细节中,我们就必须要拥有更富批判性和怀疑性的思维。
数字并不代表安全。我们不能仅仅因为风险经理说VaR是X,就认为这是有意义的。同理,相似的情况还有:Y公司的分析师说, Y公司将以Y×2010年收益率的价格进行交易;一位顾问说,某位基金经理的阿尔法是3%。只有被置于一定的背景中,这些说法才成立。如果我们用批判性思维来看待这些说法,那么它们都可能被归为伪科学的范畴。我们必须要防范那些通过使用无意义的数字来人为制造出的安全假象。
1 压力测试指将整个金融机构或资产组合置于某一特定的(主观想象的)极端市场情况下,然后测试该金融机构或资产组合在关键市场变量突变的压力下的表现状况,看其是否能经受得起这种市场的突变。——译者注