Local EPUB Text
第8章 数学
查理·芒格的智慧:投资的格栅理论(原书第2版)
第8章 数学
夜莺栖息在大树上,像往常一样唱着歌。饥饿的鹞子见了,便飞过去把它捉住。夜莺临死时,请求鹞子放了它,说自己填不满鹞子的肚子,如果鹞子真的缺少食物,就应该去寻找更大的鸟。鹞子回答说:“我如果放弃到手的现成食物,而去追求那渺茫的东西,岂不成了傻瓜了!”
毫无疑问,你一定读过这篇《鹞子与夜莺》的寓言,而且你应该知道这个故事的寓意是:“一鸟在手,胜过二鸟在林。”
这篇寓言是伊索的作品,据信他是一位生活在古希腊(公元前620—560年)的奴隶,同时也是位讲故事高手。从那以后,这篇寓言出现了很多个版本,到处传播。在《良善行为指南》(The Boke of Nurture or Schoole for Good Maners)里,休·罗兹(Hugh Rhodes)提出:“手中一只鸟,顶得上林中的十只鸟。”几年后,约翰·海伍德(John Heywood)在其鸿篇巨著《有关英语中所有包含数字的谚语的谈话》(Adialoguecon-teinyng the mumber in effect all the proverbs in the Englishetongue,1546年)中写道“一鸟在手,胜过十鸟在林”。最终是约翰·雷(JohnRay)在《谚语手册》(AHand-book of Proverbs,1670年)中给出了第一个完整的经过改良的版本,这个说法至今仍是权威解释:“一鸟在手,胜于二鸟在林。”但是我最欣赏的说法来自沃伦·巴菲特:“一个坐在我车中的姑娘,胜过五个电话联系簿上的姑娘。”
我非常确定当伊索在2600年前写下《鹞子与夜莺》这篇寓言时,他不知道自己订下了一条投资界必须遵守的戒律。
听听巴菲特怎么说:“我们用来评估股票和企业的公式是一致的。实际上,用于评估买来的资产可以产生财务收益的公式,自大约公元前600年第一次出现以来,始终没有改变过。奇迹是伊索和他的持久但也许不全面的观点‘一鸟在手胜过两鸟在林’。为了说明这个原则,你只需回答3个问题。你有多肯定树林中有鸟?它们何时会出现以及有多少只?无风险利率是什么?如果你能够回答这3个问题,你将知道这个树林中的鸟的最大数量。当然,鸟只是个比喻,你应该想的是美元。”[1]
巴菲特继续说,伊索的投资格言是不朽的。不管你将其用在股票、债券、制造企业、农场、石油特许权或是彩票上都是如此。巴菲特也指出,伊索的“公式”一直延续到蒸汽机、电力、汽车、飞机和互联网的降生。巴菲特说,你所要做的事情就是加入正确的数字,所有投资机会的吸引力就将自动排出顺序。
在这一章,我们将复习一些在聪明投资中使用的重要的数学概念:计算现金流折现、概率论、方差、均值回归以及不确定性风险。我们要回顾一些在前面章节里所学的内容,了解这些概念的起源,它们是如何演变的,以及它们对于投资者形成格栅思维有何贡献。
你可能想起了在哲学那一章里,我们提到过,我们将约翰·伯尔·威廉斯的折现现金流理论称为决定价值的最佳模型。我们也承认这个模型使用起来并不容易。你需要计算公司未来的成长率。你还得确定公司在未来能够产生多少现金。你还必须使用合适的折现比例。(从记录上看,巴菲特使用的是无风险利率,即10 年期美国国债的利率,而现代组合理论在这个无风险利率基础上又加上了一个权益风险溢价。)
由于有这些困难,许多投资者放弃了这个模型退而求其次,选择了一个二阶模型,比如市盈率、市账率或者派息率。巴菲特对这些模型都不感兴趣。这些数学比例,他说道,对于指明价值没有任何意义。充其量它们只是在投资者不能够或不愿意使用折现现金流模型时所使用的价值相对指标。
巴菲特对于每家他将投资的公司以及所在的行业,都要投入大量的时间精力去研究。他也会仔细观察管理层的行为,特别是管理层对于配置资金的想法。[2]这些都是重要的变量,但大多也是很主观的衡量方法。因此,其中也不怎么用到数学计算。相反,巴菲特投资的数学原理很直截了当。他经常提到自己可以在一只信封的背面完成大多数业务的估值计算。首先,列出现金,第二步,估计业务期的长短及业务期内现金增长的概率,然后对现金流进行折现,得出现值。
为了理解如何计算到最后一步,我们回头看看大萧条时代。
1923年,一位名叫约翰·伯尔·威廉斯的年轻人入读哈佛大学,学习数学和化学。毕业后,受到20世纪20年代股市狂潮的吸引,他成为了一名证券分析师。对于华尔街的一片牛市看法,威廉斯感到疑惑,而且觉得缺少一个决定股价内在价值的理论框架。在1929年市场崩溃之后,大萧条也紧随而至,威廉斯回到哈佛大学攻读经济学博士学位。他想弄清楚是什么原因造成了这场灾难。
在选择研究方向时,威廉斯咨询了他的导师约瑟夫·熊彼特。你可能还记得我们在生物学那一章提到过的熊彼特教授吧。熊彼特教授考虑到威廉斯的工作背景,建议他研究如何确定普通股的内在价值。1940年,威廉斯通过博士论文答辩顺利毕业。令人惊讶的是,他那篇以“投资价值理论”(The Theory of Investment Value)为题的论文,在他获得博士学位两年前就由哈佛大学出版社作为专著出版了。
威廉斯的第一个挑战是应对大多数经济学家的普遍观点,当时他们认为金融市场和资产价格主要取决于所有投资者低于资本回报的预期,这里的投资者是个集体概念。换言之,价格来自于看法和观点,而不是经济学。这个观点类似于约翰·凯恩斯那个著名的“选美比赛”论断。在其《就业、利息和货币通论》(1936)第12章,凯恩斯对于股票市场的价格波动提出了自己的解释。他认为,投资者挑选股票就像一家报纸举办一场选美比赛,要求人们从6张照片中选出最美的女人。赢得比赛的技巧,凯恩斯说,不在于你挑出了你心中最美的候选人,而是你要猜得到每个人认为哪个女人最美丽。
但是威廉斯相信金融市场的价格最终是资产价值的反映。是由经济决定的,而不是依靠看法和观点。为了证明他的结论,威廉斯从市场的时间序列(技术分析)转向寻找测量资产价值各组成部分的方法。与预测股票价格不同,威廉斯相信投资者应该关注企业的未来收益。他提出资产的价值应该通过“评估其现有价值”而加以确认。换言之,例如,一只普通股的内在价值,是投资期内未来现金流净值的现值。
在其书中,威廉斯承认,他的理论是建立在其他人研究的基础之上,他说,内在价值的概念来自于基尔德、威斯、赫德和布朗所写的一本名叫《股票增长和贴现表》(Stock Growth and Discount Tables,1931)的书中。此外,威廉斯还受益于研究了D.普兰莱希(Preinreich)《红利的本质》(The Nature of Dividends,1935)一书的数学附录。采用同样的方法,威廉斯展示了使用公司未来预期增长对公司分红进行预测。尽管威廉斯没有发明“现值”这个思想,他被看作贴现现金流概念的发明者,主要是因为他提出了一个叫作“代数预算”的模型和预测方法。
如果读者仍对于未来现金流的折现值感到疑惑的话,想想债券是如何做估值的。一只债券既有票息(现金流),也有到期日,使用这两个条件就可以确定其未来现金流。如果你把所有票息加总,然后再除以一个合适的比率,就可以得出这只债券的价格。你可以用同样的方法确定一项业务的价值。但是不用计算票息,计算该业务在未来一段时间所产生的现金流,然后再折现到今天即可。
你可能会问自己,如果未来现金流折现的现值就是决定价值的不二法则,为何投资者还要依赖于相对估值因子和二阶模型呢?因为预测一家公司的未来现金流是非常困难的。我们几乎可以准确地计算一只债券的未来现金流——因为这种计算是基于合同的条款规定。但是一个商业项目并非通过合同产生固定利率的收益。商业项目努力盈利,但是有很多外力——经济的变化难测,竞争激烈程度,有能力打破行业秩序的创新者,使得对未来现金流的预测难言精确。但这并不是我们放弃努力的借口,正如巴菲特常说的:“宁要模糊的正确,不要精确的错误。”
是的,预测增长率和现金流只能给我们一个近似结果。但是也有数学模型可以帮助我们探求这些不确定性,并让我们能够确定资产的真实价值。这些模型帮助我们量化风险,让我们能够更好地寻求近似答案。
我们可以追溯到800年前印度-阿拉伯计数系统,从中找到有关风险的基本概念。但是就我们的目的而言,关于风险的严肃研究始于欧洲文艺复兴时期。1654年,一位法国嗜好赌博的贵族舍瓦利耶·德·梅雷(ChevalierdeMéré),用一个难题挑战著名的法国数学家布莱士·帕斯卡(Blaise Pascal):“在一个未结束的概率游戏里,当一个玩家已经领先时,你如何分配筹码?”
帕斯卡是他父亲教育出来的神童,他的父亲也是数学家,在上诺曼底地区的首府鲁昂担任税务征收官。很小的时候,帕斯卡已经显示出了与众不同。在游戏室的地板上,他自己通过画图,发现了欧几里得几何学。在他16岁那年,帕斯卡写了一篇有关椎体的数学论文,这篇论文是如此前沿和详尽,连笛卡尔都说给自己留下了深刻印象。18岁那年,帕斯卡开始鼓捣一种被称为计算器的东西。经过3年的工作和做了50多个样品之后,帕斯卡发明了一个机械式计算器。又过了10年,他造出了20台被称为“Pascaline”的计算机。
德·梅雷的挑战早已为人熟知。早在200年前,僧侣卢卡·帕乔利(Luca Pacioli)就提出过同样的问题,200年过去了,这个问题依然没有答案。帕斯卡没有被吓倒,而是去找律师皮埃尔·德·费马(PierredeFermat)寻求帮助,费马也是一位杰出的数学家。费马发明了解析几何学,对于微积分的早期发展也做出了贡献。他用业余时间研究了光的折射、光学以及研究如何计算地球的重量。帕斯卡不可能找到比他更好的智力合作者了。
帕斯卡和费马通了很多信函,最终形成了今天被称为概率论的理论基础。在《与天为敌》(Against the Gods)[3]这本关于风险的杰出著作里,彼得·伯恩斯坦写道,这些通信“是数学史和概率论上的开创性事件”。尽管他们在解决这个问题时采用了不同的方法——费马使用的是代数学,而帕斯卡借助于几何学,两种方法都可以构建出一个体系,为未有结果的事物决定几种可能的概率。实际上,帕斯卡的数字三角形[4]直到今天都能被用于解决很多问题,包括你最喜爱的棒球队在丢掉第一局的情况下仍能赢得世界锦标赛的概率。
帕斯卡和费马所做的贡献,标志着我们现在称为决策理论的肇始——即面对不确定的未来,我们能够做出优化决策的过程。“做出决策,”伯恩斯坦写道,“是管理风险所需做的最基本的第一步。”[5]
我们现在了解概率论是强大的预测工具。但是正如我们所知,魔鬼隐藏在细节中。在我们这个案例里,细节就是信息的质量,构成了概率估计的基础。第一个科学思考概率和信息质量的人是雅各布·伯努利(Jacob Bernoulli),他来自一个著名的荷兰-瑞士数学世家,这个家族还包括约翰·伯努利(Johann Bernoulli)和丹尼尔·伯努利(Daniel Bernoulli)。
雅各布·伯努利确认了为赌博游戏计算概率和各种生活疑难问题的概率是不同的。正如他指出的,你无需亲自去转轮盘来指出小球落在数字17的概率。但是在现实生活中,相关的信息对于理解一个结果出现的概率是必需的。伯努利解释说,大自然的模式只是部分确定的,所以概率从本质上应该被看作确定性的程度,而不是绝对的确定性。
尽管帕斯卡、费马和伯努利在发展概率论方面都做出了重要贡献,但是另一位数学家托马斯·贝叶斯(ThomasBayes)奠定了将概率论应用于实践的基础。
托马斯·贝叶斯(1701—1761)既是一位长老会牧师,也是一位天才的数学家。他出生于费马过世后100年和帕斯卡去世后78年,默默无闻地住在伦敦南部的肯特郡。他因为和伊萨克·牛顿几乎同时发表了有关微积分的论文,于1742年被选为皇家学会(Royal Society)会员。在他的一生中,他没有发表其他数学论文。尽管如此,他在遗嘱中写明在他死后,要将其一篇文章的草稿和100英镑赠予理查德·普赖斯(Richard Price),他是附近纽文顿格林的传道士。在贝叶斯去世两年后,普赖斯将论文“关于如何解决一个概率问题”副本寄给了皇家学会的会员约翰·坎顿(John Canton)。在这篇论文中,贝叶斯奠定了统计推理方法的基础——这个问题首先由雅各布·伯努利提出。1764年,皇家学会在会刊上发表了贝叶斯的论文Philosophical Transactions。按照彼得·伯恩斯坦的说法,这篇论文是一个“令人惊讶的原创作品,奠定了贝叶斯在统计学家、经济学家和其他社会学家中的不朽地位”。
贝叶斯定理非常简单:当我们根据新信息更新我们的初始结论时,我们获得了新的改进后的结论。在莎伦·伯奇·麦格雷恩(Sharon Bertsch McGrayne)写的关于贝叶斯的书(The Theory That Would NotDie)中,她说,“我们根据客观信息改变意见:初始结论+最新的客观数据=新的改进的结论”。后来的数学家为这个方法的每一步确定了术语。先验概率指初始结论的概率,似然概率指基于最新客观数据得到新的假设概率,后验概率是指新的修改后结论的概率。麦格雷恩告诉我们:“每次系统会被重新计算,后验概率变成下一轮迭代的先验概率。这是一个演化系统,随着新的信息一点点地增加,结论也越来越接近确定无误。”[6]达尔文笑了。
贝叶斯定律给了我们一个数学方法,去更新我们初始的结论,并改变了相应的概率。下面是一个简短易懂的关于这个定律如何使用的示例。
我们假设你和一位朋友花了一下午时间玩游戏,在游戏结束的时候,再随便聊一些别的事情。你的朋友说的一番话导致你投下了一个友好的赌注:掷一次骰子得到数字6。直接算出的概率是1/6,即概率为16%。但是假设你的朋友马上掷了一次骰子,快速用手盖住,悄悄看过,她说:“我能告诉你的就是这是一个偶数。”根据这个新信息,你的概率变为1/3,33%的机会。当你正在考虑是否要改变赌注时,你的朋友开玩笑地加了一句:“不是4。”现在你的概率又变为1/2,即猜对的机会为50%。在这个非常简单的过程中,你已经做了一个贝叶斯分析。每一次新信息都影响了原来的概率。
贝叶斯分析就是尝试把所有可以得到的信息纳入进行推理或决策的过程。大学采用贝叶斯定律帮助学生学习决策过程。在课堂上,贝叶斯方法被称作更为通俗易懂的“决策树”,每一条树枝代表了新的信息,反过来,改变了决策的概率。“在哈佛商学院,”查理·芒格解释道,“对于第一学年的学生,做得最多的数量化练习就是被他们称作决策树的理论。他们所做的就是将高中所学的代数用于现实生活中的问题。学生们很喜欢这个方法。他们惊奇地发现高中代数在生活中用得着。”[7]
现在让我们把贝叶斯定理加入威廉斯的折现现金流模型中,我们已经知道应用这种方法的一个挑战是预测未来的不确定性。概率论和贝叶斯定理帮助我们克服了这种不确定性。而对于折现现金流模型,还有一个批评是对于在非线性世界中运营的公司的经济回报,却采取了线性外推的方法。模型假设在折现的未来数年里,现金增长率将维持在不变的水平。但是这种情况——任何一家公司都能产生可精确预测的不变的回报率,显然是不太可能发生的。经济波动总是上下起伏,消费者是易变的,竞争者很残酷。
投资者如何根据这些可能性对估值进行修正呢?
答案是扩展你的决策树,以容纳不同的时间区间和增长率。比如说,你想确定某家公司的价值,已知该公司过去一年现金增长率为10%,你可能很合理地假设该公司在未来5年有50%机会保持同样的增长率,有25%机会达到12%增长率,还有25%机会达到8%增长率。接着,由于经济环境会引发竞争和创新,你可能降低未来第6~8年的增长率假设,假设达到8%增长率的概率为50%,6%增长率的概率为25%,还有25%的概率达到10%增长率。然后再为第9年和第10年做出假设。
对于概率的解释可以分为两个大类别:其一是物理概率,更常用的叫法是频次概率,通常与在长时期里可以产生巨量数据的系统在一起,例如轮盘赌、抛硬币、掷骰子和纸牌游戏,但是频次概率也可以包括对汽车事故和人寿的概率估算。是的,汽车和驾驶员是不同的,但在特定地区驾驶汽车的人之间具有足够明显的相似性,能够在几年时间里产生海量的数据,并给出类似频次的解释。
当事件出现的频次在一段时间里不够多,不足以分析结果时,我们必须求助于事件的概率,通常指的是主观概率。重要的是记住,主观概率能在任何情况下使用,即便在不包括随机过程的情况下,作为一种表达“主观”倾向性的方式。根据贝叶斯分析的教科书,“如果你相信自己的假设是合理的,完全可以对某个确定的事件给出一个等于频次概率的主观概率”。[8]你需要做的只是根据合理性,把不合理和逻辑有毛病的筛除掉。
主观概率不是基于精确的计算,通常是由有知识的人做出的合理推断。不幸的是,当涉及金钱,人们并不总是能够保持理性或者懂道理。我们也知道主观概率可能包含了很多个人偏差。
任何时候在使用主观概率的时候,重要的是记住我们有机会犯的行为金融错误和个人思维偏差。决策树只是在输入有用的时候才起作用,而静态概率——还没有被更新的概率没有多少价值。只有不断根据客观信息更新概率,决策树才能起到作用。
不管是否认识到此点,实际上,决策者所做的决定都是概率练习题。为了成功,重要的是他们对概率的描述应该包括历史记录和最新的数据。这就是贝叶斯分析的用武之地。
在克劳德·香农写出“通信的数学理论”之后的8年(第5章),贝尔实验室年轻科学家詹姆斯·拉里·凯利二世(James Larry Kelly Jr.)研究了香农那篇著名论文,并在此基础上提出了新概率论。[9]
凯利曾与香农一同在贝尔实验室工作,所以仔细研究过香农的数学模型。在香农的论文中,提出了一个最优数量的信息的数学公式,用于计算信息通过铜线传输的成功概率。凯利指出香农的各种传输率以及关于一个机会事件的可能结果,基本上是一回事——概率,同一个公式可以优化这两个问题。他在一篇名为“信息率的新解释”论文中提出了自己的想法,这篇文章于1956年发表在《贝尔系统技术月刊》(The Bell System Technical Journal)上,打开了帮助投资者做出组合决定的数学之门。[10]
被应用于投资的凯利标准,也被称为凯利优化模型,被视为优化成长策略。它可以计算出一系列赌注的优化规模,随着时间推移,使得组合的增长率达到最大值。该模型建立在一个简单的思想之上,即如果你了解成功的概率,你可以用一小部分存款获得最大的增长。用数学公式表示为:2p-1=x,即2倍的成功概率减去1等于可以用于赌注的存款的比例。例如,如果打败赌场的概率是55%,你应该用存款的10%去做赌注,以使赢得的钱达到最大值。如果赢率是70%,那么就拿出40%存款去赌。如果你知道赢率是100%,模型会告诉你,把全部存款都拿去做赌注。
埃德·奥克利·索普(Ed Oakley Thorp)是一名数学教授,玩21点的高手,对冲基金经理和作家,是将凯利标准应用于赌场和股票市场的先驱。索普1959~1961年曾在麻省理工大学工作,在那里遇到了克劳德·香农,读过凯利的论文。他立即着手证明凯利的方法是否真的适合自己。索普学过Fortran编程语言,所以他可以用大学的计算机将凯利的方法编成电脑程序,解决打扑克中遇到的各种概率方程。
索普的策略建立在一个简单的概念之上。当桌面上已经出现10张牌时,亮牌面,打牌人在统计上比发牌人占优势。如果你给大牌设定-1分,给小牌设定1分,就能很容易记住出过的牌:只需随时心算,在每张牌出现后做加减法就可以了。当计数变为正数时,你就知道还有更多的大牌还没出现。聪明的打牌人会等到计数值达到较高的数字时,再下较大的赌注。
索普继续改进扑克牌计数系统。他修改计算机程序以便用凯利标准确定每次下注的权重。不久之后,他去拉斯维加斯实地检验了他的理论。他以10000美元起步,第1周就翻了1倍。他声称本来可以赢得更多,但是引起了赌场保安部门的注意,他被赶出去了。
几年后,索普成为21点爱好者中的名人,当人们知道他是用一台破电脑来下注的,他的声誉便直线蹿升。这台由他和克劳德·香农共同开发的设备,是第一台用于赌博的电脑,现在会被认为属于非法。因为不能继续将他的数学理论应用于赌场,1962年,索普把在拉斯维加斯赌博的经验写成了《打败庄家》(Beat the Dealer),该书成为《纽约时报》最佳畅销书,卖出了700多万册。直到今天,这本书仍被视为原汁原味的记牌和下注手册。
凯利标准已经成为主流投资理论的一个组成部分。有些人相信沃伦·巴菲特和PIMCO的著名债券投资经理比尔·格罗斯也使用凯利方法管理他们的投资组合。威廉·庞德斯通在他2005年的书《财富公式:击败赌场和华尔街的科学投注系统未被披露的故事》中,更进一步普及了凯利标准。尽管凯利方法具有学术血统和简单的公式,我还是要提醒:凯利标准值能用于最有经验的投资者,甚至对他们也有所保留。
理论上,凯利标准在以下两个方面是优化的:①达到一定水平的输赢所需的最少时间;②财富提升的最大比率。例如,两位21点游戏者,每人有1000美元,24小时都在玩这个游戏。第1个游戏者每手牌只能下注1美元,第2个游戏者可以根据手中牌的好坏改变赌注。如果第2个人遵从了凯利方法,根据赢率下注的话,很可能在24小时之后他的成果要远好于第1个人。
当然,股票市场远比玩21点扑克牌复杂,后者只有有限张牌,所以可能出现的结果也是有限的。股票市场有数千家公司和几百万投资者,以及大量可能出现的结果。使用凯利方法和贝叶斯定理,需要不断重新计算概率和调整投资流程。
因为在股票市场我们处理的概率都是小于100%,总有机会出现亏损的结果,使用凯利方法,如果你算出有60%的赢率,就会拿出20%的资产进行赌博,即便这里只有2~5次赌输的机会,还是有可能出现。
凯利标准中有两个缺点经常被忽略:你应该①有一个无限的存款,②无限的时间区间。当然,没有哪个投资者拥有这两个条件,所以我们需要修改凯利方法。还要说明的是,给出的答案是以简单算术的形式给出的数学结果。
为了避免“赌徒毁灭”的结局,你可以通过减少赌注将风险最小化——对凯利方法进行折中处理。例如,如果凯利模型要你将资产的10%下注(表示成功概率有55%),你可以选择只投资5%(凯利计算的一半)或者2%(凯利结果的一小部分)。减少赌注可以为组合管理提供安全边际,同时,我们通过选择个股,可以获得双重保护和一个舒适的心理水平。
由于过度赌博的风险远大于对减少赌注的惩罚,投资者绝对应该考虑将凯利方法算出的结果进行缩减处理。不幸的是,最小化赌注也带来了潜在收益的最小化。但是由于凯利模型具有抛物线性质,所以对减少赌注的惩罚并不严重。凯利折半法,即把算出的赌注减少一半,只会将盈利增长率减少25%。
“凯利系统适用于那些只想看到资产随时间大幅增长的人,”艾德·索普说,“如果你有大量时间和足够的耐心,这个工具正适合你用。”[11]
美国著名的古生物学家和进化生物学家史蒂芬·杰伊·古尔德在40岁的时候,被诊断出腹部皮脂瘤(abdominal mesothelioma),这是一种少见和严重的癌病变,他很快做了手术切除。术后古尔德问医生他应该读什么书才能对这种疾病了解更多一些。医生告诉他“没有多少书有介绍过这种病”。[12]
古尔德没有放弃,他一头钻进哈佛康特维医学图书馆,将“皮瘤”这个词键入计算机,再花了1小时阅读了几篇最新文章后,古尔德理解了他的医生的说法。所有信息都是直白的:皮瘤是不治之症,存活期中位数只有8个月。古尔德惊呆了,坐在那里无法动弹,直到脑子重新恢复清醒,他笑了。
8个月的中位数存活期意味着什么?中位数就是一串数字中间的那个数。无论怎么分组,有一半数字会比中位数小,另一半数字比中位数大。在古尔德这个案例里,一半被诊断出皮瘤的人会在8个月内死亡,而另一半的存活时间将比8个月更长。(另两个表示中心趋势的量值是均值和众数。均值是将所有数加总之后再除以数据个数,得到一个简单平均数。众数指的是出现最多的数值。例如,在数字串1,2,3,4,4,4,7,9,12中,4就是众数。)
大多数人将均值看作现实,而很少考虑可能的偏差。用这种方式看问题,“8个月死亡中位数”意味着他将在8个月后死亡。但是古尔德是一位生活在差异世界的演化生物学家。让他们感兴趣的不是发生事件的均值,而是系统随着时间变化而产生的差异。对他们来说,均值和中位数只是抽象数字。
我们大多数人倾向于将世界看成具有正态分布的特征,两边各有一个均等的尾部,均值、中位数和众数是一致的。但是正如我们已经知道的,大自然并不总是这样规规矩矩地符合正态对称的分布,而是有时向某一方倾斜。这种分布根据尾部延长的方向分为左偏或右偏。
古尔德这位生物学家没有把自己看作一个普通的皮瘤患者,而是作为皮瘤患者群体的一个个体。通过深入调查,他发现患者的存活期是明显右偏的,意味着存活期超过8个月的人的实际存活时间要远比8个月更长。
是什么原因导致了分布左偏或者右偏呢?一句话,是差异。当中位数的某一边差异增大时,钟形曲线这一边就会被拉长。继续看古尔德的病例,那些存活期超过8个月的患者表现出了更高的方差(许多人不只是多活了几个月而是几年),这些人将存活期的分布拉向了右边。在这个右偏分布中,对于中心趋势的测量不是偶然的,中位数处于众数的右边,均值在中位数的右边。
古尔德开始考虑这些构成了右偏分布的患者群体的特征,他们的存活期都超过了中位数。毫不奇怪,他们都很年轻,大多健康状况良好,并及早诊断出了病症。古尔德的情况也是如此,所以他推算自己也有机会远远超过8个月的存活期。实际上,古尔德又活了20年。
“我们的文化里具有一种忽视或者忽略差异的强烈偏差,”古尔德说道,“我们倾向于只关注中心趋势,相当实用主义,结果经常是犯一些很可怕的错误。”[13]
投资者从古尔德的经历中得到的最重要的经验是关注系统趋势和系统内部趋势之间的差别。换一种说法,投资者需要理解股票市场平均回报水平与单只股票表现的差别。对于投资者而言,处理差别的最简单的方法是研究边缘市场(sidewaysmarkets)。
大多数投资者经历过两种股票市场——牛市和熊市,即升市或者跌市。但是还有第3种人们不太熟悉的市场类型,被称为边缘市场——随着时间变换,价格几乎没有发生改变。
一个非常知名的边缘市场案例发生在1975~1982年。1975年10月1日,道琼斯工业平均指数站上了784点。差不多7年之后,1982年8月6日,道指再次非常接近784点。尽管在这段时间里,名义收益已经增长了,但是价格却下跌了。在1975年年底,标普500的连续市盈率倍数接近12倍,而在1982年秋天,已经跌到了大约7倍。
一些股市预测者试图将曾经发生的事情与未来可能发生的情况进行类比分析,考虑到企业利润增长率和脆弱的全球经济复苏之间存在不协调。一些人害怕货币管理当局的大规模刺激会造成商品价格上涨、通货膨胀和美元贬值。这反过来会刺激股票市场,导致市盈率下跌。最终,投资者可能面临市场长期疲软,而他们被劝告最好避免投资股市。
当我第一次听到这样的说法——我们可能面临一个类似20世纪70年代晚期的边缘市场状况,最好避免投资股票时,我感到很疑惑。边缘市场真的无法让长期投资者获利吗?沃伦·巴菲特在这段时间里已经创造出了辉煌的收益,而且他的朋友和哥伦比亚同班同学比尔·鲁安(Bill Ruane)也是如此。1975~1982年,巴菲特的伯克希尔-哈撒韦公司创造出了累计达676%的总回报,鲁安和他的红杉基金合伙人里克·坎尼夫(Rick Cunniff)创造了415%的累计回报。他们是如何在这样一个边缘市场中获得如此出色的业绩呢?我决定做更深入的研究。
首先,我检查了1975~1982年市场上最大的500只股票的投资回报,特别查看了那些为股东创造了显著收益的股票。在8年的时间里,只有3%的股票在1年中价格上涨了1倍以上。当我把观察时间延长到3年时,结果更让人激动:在这连续3年里,18.6%的股票,也就是500只里有93只股票价格平均翻了一番。然后再延长到5年,结果更令人惊讶,平均有高达38%的股票,即500只中有190只股票的价格上涨超过了1倍。[14]
用古尔德的话说,投资者观察到了1975~1982年的股市情况,并关注于市场均值而形成了错误结论。他们错误认为市场处于边缘状态,而实际上市场的差异非常大,有大量机会赢得超额回报。古尔德告诉我们“将整栋房子抽象为单一符号(平均值),然后追踪其随时间变换的轨迹的旧式柏拉图策略,通常会导致错误和困惑”。因为投资者有“确认趋势的强烈愿望”,通常会导致他们“发现一个根本不存在的趋势”。其结果是,我们完全误读了系统中扩大或者收窄的差异。“在达尔文的世界里,”古尔德说,“差异代表了基本现实,而计算平均值是一种抽象手段。”[15]
在《证券分析》这本书的首页上,本杰明·格雷厄姆和戴维·多德引述了昆图斯·霍拉提乌斯·霍拉修斯(Quintus Horatius Flaccus,公元前65-8年)的一段话:“现在已然衰朽者,将来可能重放异彩;现在备受青睐者,将来却可能日渐衰朽。”正如伊索并不了解他的寓言“老鹰和夜莺”是折现现金流模型的文学化比喻,我也敢肯定豪瑞斯也没意识到他写出了均值回归的公式。
当你听到有人在说,“都达到了平均水平”,这是对回归均值的一个口语化说法——是一种统计现象,其核心是描述特别高或者特别低的数值逐渐向中间值靠拢的趋势。在投资中,这是指很优秀或很糟糕的业绩都不太可能持续,稍后可能会向相反方向转变。(这就是为何有时被称为向均值回归的原因。)回归均值,正如彼得·伯恩斯坦指出的,是很多说教的核心说法,比如“世事有起有落”“骄兵必败”。约瑟夫对法老的预言是7年丰收之后将有7年灾荒。而且伯恩斯坦告诉我们,这也是投资的核心思想,因为回归均值是一种常见策略——经常被用于甚至是被过度用于选股和预测市场。
我们可以把回归均值这一数学发现归功于弗朗西斯·高尔顿爵士,他是一名英国知识分子,也是查尔斯·达尔文的外甥。(你可能还记得我们在“社会学”那一章提到过高尔顿和他的称牛比赛。)高尔顿对于商业和经济学毫无兴趣。其实他的一项主要研究是理解为何一个家族的天分能够代代相传——也包括达尔文家族。
高尔顿受到了比利时一位名叫兰伯特·阿道夫·雅克·凯特勒(Lambert Adolphe Jacques Quetelet,1796—1874)的科学家启发,他比高尔顿年长20岁,凯特勒已经建立了布鲁塞尔观察站(BrusselsObservatory),而且精通于将统计方法引入社会科学。他的主要贡献是识别了社会结构和人类的物理特性中存在着正态分布。
高尔顿沉迷于凯特勒的发现“最令人惊讶的有关均值发散的理论定律(正态分布)是独特的,特别是在测量人体体重和胸围时更是如此”。[16]他当时正在撰写其最重要的作品《遗传的天才》(Hereditary Genius),尝试证明是遗传本身而非教育和后天的职业生涯是特殊才能的来源。但是凯特勒的均值发散理论挡在他的路上。高尔顿获得理论进展的唯一方法是解释正态分布中的不同点是如何发生的。他所能做的事就是首先指出数据是怎样自我组织的,在做的过程中,高尔顿完成了被彼得·伯恩斯坦称为“杰出的发现”,对投资界起到了巨大的影响作用。
高尔顿的第一项实验是关于力学的,他发明了Quincunx,这是一种不常见的钉球游戏机,外形像是一个瓶颈部带有20个齿的沙漏。他在皇家学会面前展示了自己的想法,高尔顿随机地放入几只小球,它们就会以典型的高斯分布滚入沙漏底部的不同间隔内。之后他研究了花园里的豌豆——或者更具体一些,就是豆荚中的豆子。他对几千个豌豆做了测量和称重,挑出10组豆子寄给在英国各地的朋友,附上具体的种植指引。当他研究这10个不同组种好的豌豆时,高尔顿发现他们的物理属性也是表现出和Quincunx一样的高斯分布。
这项实验与其他试验,包括父母与子女间身高差别研究,被认为是向均值的回归或反转。“反转,”高尔顿说,“是从父母类型演变出的理想的子女类型的趋势,恢复到可能的平均祖先类型。”[17]如果过程不是这样的话,高尔顿解释说,那么个头大的豌豆将产出更大的豌豆,而小豌豆的后代也会更小,直到这个世界变成除了最大和最小,其他什么都没有的状态。
J.P.摩根曾被问及股市未来是什么样子。他答道:“将会波动。”当时没有人想到这是描述均值回归的婉转方式。但是这个现在已经非常出名的回复已经成为逆向投资者的信条。他们会告诉你,在均值回归出现前,贪婪会把股价推得越来越高,离它的内在价值越来越远。而恐惧会迫使股价远离内在价值,变得越来越低。系统中的方差会逐步被纠正。
很容易理解为何回归均值会被华尔街当作一个非常普遍使用的预测工具。这是一个可以用于预测未来的简明的数学工具,但是如果高尔顿的法则是正确的,为何预测这么困难?
这个困惑来自3个渠道。第一,回归均值并不总是立即发生。过高估值和过低估值可能会保持较长时间——非常长的时间,远比耐心的理性能够预期的时间还要长。第二,波动性非常高,而偏差也很不规则,使得股价不会自动纠正或者不会很容易回复到均值上。最后也最重要的是,在流动性环境中(如市场)均值自身也是不稳定的。昨天的常态不是明天的常态,均值可能会漂移到新的位置。
在物理学体系中,均值是稳定的。我们可以把某个物理实验做1万次,而每次都能得到基本一致的均值。但是市场是生物学系统。系统中的代理人——投资者学习并适应不断变化的环境。现今的投资者的行为,他们的想法、意见和推理,与上一代投资者是不同的。
直到20世纪50年代,普通股的分红水平通常高于政府债券的利息。这是因为经历了1929年股市崩溃和大萧条时期的一代人要求更高的安全性,如果他们购买股票的话,会要求得到比债券利息更多的分红。他们可能已经用到了这个术语,但实际上他们采用的是均值回归的简单策略。当普通股的红利接近或者低于政府债券利息时,他们就卖出股票买回债券。加尔顿的法则会重置价格。
当经济在20世纪50年代重新恢复繁荣时,20世纪30年代遭遇过惨烈股票损失的一代人重新拥抱了普通股。如果你坚信普通股的收益会回到比债券更高的水平的话,你大概已经亏了钱。一个从现在市场上得到的例子:在一系列事件的冲击下,2011年许多普通股的分红率已经超过了10年期美国政府债券。按照回归均值的方法,你应该已经卖出债券换回股票。然而到了2012年,债券却继续跑赢股票。这种远离均值的经济偏差会持续多久呢?抑或均值已经偏移了吗?
大多数人认为标普500指数是一篮子很少改变的消极管理的股票。但事实并非如此。标准普尔的筛选委员会每年都会剔除一些公司,再加入新的公司,大约占指数中总公司数量的15%,差不多75家公司会被换掉。一些公司因为被其他公司收购而被剔除,其他被剔除的公司是因为经济表现不佳,已不再符合最大500家企业的标准。新加入的公司通常是行业内健康和有活力的公司,对于经济有正面影响。因此,标普500指数是以达尔文方式演变,用越来越强大的公司充实自己——适者生存。
50年前,标普500指数主要由制造业、能源和公用事业的公司组成。现在占主要地位的是技术、保健和金融类公司。由于后三类公司的股权回报高于前一组的三类公司,现在指数的股权平均回报要高于30年前,均值已经发生了漂移。用托马斯·库恩的话说,就是发生了范式转变。
过度强调现状而不理解组成的微妙变化,会导致做出危险和错误的决定。尽管回归均值仍是一个重要的策略,投资者仍认为它是不可违背的策略。股票被认为价格可以高了再高,价格低的股票可以继续下跌。重要的是让你的思维保持弹性。尽管回归均值更可能是市场的错误结果,但它却是神圣不可侵犯的。
德国哲学家和数学家弗里德·莱布尼茨(Gottfried Leibniz,1646—1716)写道,“大自然已经从不断重复的事件中建立了模式,但这只是对于大部分”。[18]这一章的数学主要是为了帮助投资者理解,以便他们可以更好地预期“重复事件”。但是我们还要面对不确定性、不连续性、不规则性、波动性和肥尾。
美国经济学家弗兰克H.奈特(FrankH. Knight,1885—1972)曾在芝加哥大学工作,并被认为创立了芝加哥经济学派。他的学生包括诺贝尔经济学奖获得者詹姆斯·布坎南(James Buchanan),米尔顿·弗里德曼(Milton Friedman)和乔治·斯蒂格勒(George Stigler)。奈特最著名的著作是《风险、不确定性和利润》(Risk,Uncertainty,andProfit),在书中他尝试将经济风险和不确定性区分开来。他说,风险包括了那些由极端概率分布决定的未知结果的情形,我们可能准确地了解什么将会发生,但是基于过去的事件以及发生的概率,我们应该对于什么最有可能发生有一个接近的看法。
不确定性有所不同。我们不知道结果会是怎样,但是我们也不知道分布是怎样的,这就是一个更大的问题。奈特式的不确定性是不可度量和无法计算的。只有一件事是不变的:意想不到。
纳西姆·尼古拉斯·塔勒布(Nassim Nicholas Taleb)在他的畅销书《黑天鹅:如何应对不可预知的未来》(The Black Swan:The Impact of the Highly Improbable,2007年)中将投资者和奈特对于不确定性的注解重新对应了起来。塔勒布笔下的“黑天鹅”事件具有3个特征:“①是一种异常事件,出于常规预期的范围之外,过去发生的事情无法令人信服地指出其发生的概率,②带来极端影响,③无视其特殊性,人类本性促使我们在事后编造解释,使其变得可以解释和可预测。”[19]
在《黑天鹅》一书中,塔勒布的目标是帮助投资者更好地预防难预测、影响大和稀少事件的不成比例的角色——一个在我们历史、科学、技术和金融方面超过正常预期的天生的黑天鹅事件。他想让人们关注这类极其少见的具有小概率的事件具有无法用科学方法加以计算的本质。最后,他想揭示人们对于不确定性和历史稀有事件的心理偏差和盲目性。
根据塔勒布的说法,我们对于什么即将发生的假定来自于钟形分布的可预测性曲线——我们称其为“平均斯坦”(Mediocristan)。相反,他将这个被粗暴的不可预测的强大事件打造的世界称为“极端斯坦”(Extremistan)。在塔勒布的世界里,“历史不是匍匐前进的,而是跳跃发展的”。
1941年爆发的珍珠港偷袭和2001年“9·11”对世贸中心的恐怖袭击就是黑天鹅事件案例。两件事都超出了预期范围,都带来了极端影响,而在事后都得到了充分解释。不幸的是,黑天鹅这个术语已经被通俗化了,媒体将这个说法用于任何一个不常见的事件上,包括少见的暴风雪、地震和股市波动。这类事件其实更适合加上“灰天鹅”标签。
统计学家对黑天鹅事件也有一个说法,称为肥尾。《纽约时报》专栏作家威廉·萨菲尔(William Safire)对这个术语是这样解释的:在正态分布中,钟形曲线是中间高而宽,两边逐渐下降,底部变得扁平。在底部出现的极端事件,无论在右侧还是左侧,都称为尾部。当尾部凸起而不是呈现出正态分布的逐渐变平的形态时,这样的尾部被称为“肥尾”。[20]塔勒布的黑天鹅事件显示出肥尾。在统计学中,距离均值的5倍标准差或以上范围里出现的事件被视为极端稀少情况。
和黑天鹅一样,肥尾已经成为专门的投资术语。我们经常会听到投资者不能容忍再发生一次“左侧肥尾”事件。机构投资者正在购买“左尾”保险,对冲基金正在出售“左尾”保障。我认为这个术语一定是被误用了。今天,出现任何与正常有偏差的事件都会被贴上黑天鹅或者肥尾标签。
数学和物理学一样具有诱导性。数学引导我们寻求精确和远离模糊。在对过去进行量化处理以便预测将来可能发生什么的主观认识之间,并不存在清晰的关系。经济学家和诺贝尔奖获得者肯尼思·阿罗(Kenneth Arrow)警告我们,投资风险管理的数学方法中包含了破坏性的种子。他写道,“我们对于事物发展方式的知识,无论是社会的还是大自然,都充满了模糊认识。对于确定性的观念充满了错误。”[21]
这不是说概率、方差、均值回归和肥尾是无用的。情况远非如此。这些数学工具帮助我们缩窄了市场中存在的不确定性——但并没有消灭它。“风险管理被视为一项实践艺术,对此有一句简单而充满丰富含义的陈腔滥调作为注脚:当我们的世界被创造出来之时,没有人记得要把确定性包括进来,”彼得·伯恩斯坦说道,“我们从不肯定,我们通常或多或少有些无知。我们掌握的大多数信息要么是不正确的,要么是不完整的。”[22]
英国文学批评家和布朗神父系列神秘小说作家吉尔伯特·基思·切斯特顿(Gilbert Keith Chesterton),准确地抓住了我们的两难处境:
我们这个世界的真正麻烦,不在于它是一个理性的世界,也不是因为它是一个不理性的世界。最大的麻烦是它近乎理性却又不是非常理性。生活不是没有逻辑性的,却是逻辑家的陷阱。它看上去比实际更数学化且更有条理,其精确性是明显的,但是不精确性却被隐藏了起来。它的野性在伺机而动。[23]
[1] Warren Buffett, Berkshire Hathaway 2000 Annual Report, 13.
[2] Robert G. Hagstrom, The Warren Buffett Way: Investment Strategies of the World’s Greatest Investor (New York: John Wiley & Sons, 1994).
[3] 此书中文版已由机械工业出版社出版。
[4] 在中国称为杨辉三角形、贾宪三角形,是二项式系数在三角形中的一种几何排列。——译者注
[5] Ibid.
[6] Sharon Bertsch McGrayne, The Theory That Would Not Die (New Haven: Yale University Press, 2011), 8.
[7] Charles T. Munger, Outstanding investor digest (May 5, 1995): 49.
[8] Robert L. Winkler, An Introduction to Bayesian Inference and Decision (New York: Holt, Rinehart and Winston, 1972), 17.
[9] 詹姆斯·拉里·凯利最值得纪念的时刻是在1962年,当时他使用IBM704型计算机编写合成声音程序。凯利建立了一个声音记录合成器系统,并重新创作了马克斯·马修(Max Mathews)谱写的那首乐曲“黛西贝尔”。正巧亚瑟·克拉克(Arthur C. Clarke)来访贝尔实验室。
[10] J. L. Kelly Jr., “A New Interpretation of Information Rate,” The Bell Systems technical journal 35, no. 3 (July 1956).
[11] 作者于1998年11月25日拜访了艾德·索普。
[12] 以下的内容参考1985年Disocover上的文章The Median Isn’t the Message以及Stephen Jay Gould, “Case One: A PersonalS-tory,” chap. 4 in Full House: The Spread of Excellence from Darwin to Plato (New York: Three Rivers Press, 1996)。
[13] Sam L. Savage, The Flaw of Averages: Why We Underestimate Risk in the Face of Uncertainty (New York: John Wiley & Sons, 2009), 11.
[14] Robert G. Hagstrom, “Who’s Afraid of a Sideways Market” Legg Mason perspectives (January 2010).
[15] Gould, Full House, 41.
[16] Bernstein, Against the Gods, 162.
[17] Sir Francis Galton, quoted in Bernstein, Against the Gods, 167. It is referenced in the biography by D. W. Forest, Francis Gatton: The Life and Work of a Victorian Genius (New York: Taplinger, 1974).
[18] Gottfried Leibniz, quoted in Bernstein, Against the Gods, 329.
[19] Nassim Nicholas Taleb, The Black Swan: The Impact of the Highly Improbable (New York: Random House, 2007), xvii.
[20] William Satire, “On Language: Fat Tail,” New York Times (2oo9), http://www .nytimes.com/2009/02/08/magazine/o8wwwln-safire-y. html.
[21] William Satire, “On Language: Fat Tail,” New York Times (2oo9), http://www .nytimes.com/2009/02/08/magazine/o8wwwln-safire-y. html.
[22] Bernstein, Against the Gods, 207.
[23] Gilbert Keith Chesterton, “The Paradoxes of Christianity,” chap. 6 in Orthodoxy (Charleston, SC: BiblioBazaar, [1908] 2007).