Local EPUB Text
第4章 游戏的规则
令人惊讶的一个事实是:华尔街对于具备某些特征的证券的历史走势的系统性知识是如此之少。诚然,我们有显示各类股票及单个股票长期价格走势的图表。但是,除了划分了行业类型之外,我们并没有对股票进行真正的分类。过去的分析师似乎并未给当下及未来的分析人员传下来什么知识和技术,更谈不上对这些知识与技术进行不断的积累、扩展了。当我们对金融业的发展与医药业的发展进行比较时,历史似乎都在指责我们对过往经验所做的记录及分析是如此的贫乏。我们缺乏成型的经验,而这些成型的经验可以告诉我们哪些资料有价值,哪些资料没有价值。在未来,我们的分析师必须到学校去学习那些已成型的学科,去学习那些搜集数据、分析数据的能力,再从这些学习过程中形成适合我们行业特点的研究方法。
——本杰明·格雷厄姆,现代证券分析之父,1946年
20世纪90年代初期,即我开始进行研究并最终借此形成本书时,对格雷厄姆在上面提出质疑,几乎没有什么很好的答案。本书第1版于1996年出版,书中包含了格雷厄姆在50多年前分析的诸多变量。《投资者的头号法则》(What Has Worked in Investing:Studies of Investment Approaches and Characteristics Associated with Exceptional Returns)是由Tweedy Browne基金公司的基金经理在1992年出版的一本小册子。在这本小册子里面,他们对这一研究进行了持续更新。这本小册子是对50多项研究的一个综述与说明,这些研究被认为最能代表那些在长期内最有效的投资策略。当然,研究人员也对各种投资策略进行了大量的研究。在过去的几年里,许多研究人员也对过去几十年间的股票市场的数据进行了研究,并向大众公布了他们的研究成果。有一本书值得一提,这就是由埃尔罗伊·迪姆森、保罗·马什及迈克·士丹顿教授所著的《投资收益百年史》,这本书搜集整理了16个国家在过去101年间的投资收益情况,还逐个比较了各种各样的投资策略(如成长型与价值型投资策略等)。自本书第1版发行以来,还有一些引人注目的学术文章发表,这些学术文章包括:由查尔斯M.C.李(Charles M.C.Lee)和巴斯卡兰·斯瓦米纳坦(Bhaskaran Swaminathan)于1998年发表的Price Momentum and Trading Volume,由克利福德·阿斯尼斯(Clifford Asness)在1997年发表的The interaction of value and momentum strategies,由约瑟夫D.皮奥特洛斯基(Joseph D.Piotroski)于2000年发表的Value Investing:The Use of Historical Financial Statement Information to Separate Winners from Losers。其他一些学者,如尤金·法玛(Eugene Fama)与肯·弗伦奇(Ken French),为小盘股及大盘股构建了成长型及价值型指数,选取的数据上溯至1927年。法玛与弗伦奇使用公司的市净率,将股票划分为价值型股票或成长型股票,低市净率的股票属于价值型指数,高市净率的股票属于成长型指数。这些研究数据为我们提供了这两种主要的投资策略时间跨度最长的历史收益率。在本书这一版中,我们还将在几个单因素或多因素模型中使用CRSP数据库。CRSP数据库由芝加哥大学商业研究院创设,数据从1959年开始编制。芝加哥大学为纽约证券交易所上市的股票编纂了第一份月末价格及总收益的计算机可读文件,还额外编辑了其他一些数据项目,数据截取时间为1926~1960年。证券价格研究中心已经对其数据库进行了扩展,额外纳入了一些交易所及信息。现在有了CRSP数据库,我们就可以用它来说明:与我们在本书之前的几个版本中的一些发现一样,和单纯依赖简单的纯成长型或纯价值型投资策略相比,将价值型特征及成长性特征结合在一起,通常会得到更好的结果。
在过去的几十年里,许多学者将他们自己的研究与实践相结合,他们利用已得到证明的研究成果,开始成立自己的基金公司。在其开创性的论文《逆向投资策略、推断和风险》(Contrarian Investment Extrapolation and Risk)中,约瑟夫·拉格尼沙克(Josef Lakonishok)、安德里·史雷夫(Andrei Shleifer)及罗伯特W.维什尼(Robert W.Vishny)教授成立了LSV资产管理公司,这家公司目前掌管着530亿美元,使用他们经过长期研究得到的成果作为公司的投资策略。正如他们的网页上所宣称的那样,他们坚持使用经过考验的投资策略:“由LSV资产管理公司所使用的量化投资策略是过去20年的学术研究成果,所使用的方法经过严格测试,并且严格执行风险控制。”
然而,这些研究是有价值的,是因为它们在几十年里的稳定收益,而不仅仅是只有几天或者几年。许多投资者认为5年的投资记录已经足够用来判断一位基金经理的水平。但是,正像亚历山大·蒲柏(Alexander Pope)的格言“一知半解,为害不浅”那样,投资者在研究上下的功夫太少,这让他们获得了太多极具误导性的信息。理查德·布雷利(Richard Brealey)是一位英国经济学家,也是一位令人尊敬的数据分析研究员。按照他的估算,要对某个投资策略的有效性(假设它在统计上具有95%的相关性)做出合理假设,你需要25年以上的数据。
短期毫无价值
想一想那“繁荣的20世纪60年代”吧。那一时期追求高成长性的投资经理们在不同股票之间转换的频率如此之快,以至于得到了一个“快枪手”的称号。这个游戏的名字叫业绩成长,而买入具有髙盈利增长率的股票则是实现这一目标的手段。在那个时代,这些疯狂的投资者主要关注成长最快的公司,根本不考虑自己到底为每一美元的成长支付了多少钱。
从事后诸葛亮的角度来看,我们就能看出一个5年期的误导性有多大了。从1964年1月1日~1968年12月31日,如果将10 000美元投资于某个投资组合(该投资组合每年买入Compustat数据库中每股收益增长百分比最髙的前50只股票),这笔投资将于期末暴涨至33 500美元,年复合收益率为27.34%,是同期标准普尔500指数年收益率的两倍多。同一时期,在期初投资10 000美元于标准普尔500指数,期末将增值至16 220美元,每年的年复合收益率为10.16%。但不幸的是,同样的策略在下一个5年期内的表现就没有这么好了。1969年1月1日~1973年12月31日,按照这一策略进行的投资损失了一半以上的价值,而标准普尔500指数的同期收益率则为2%。我们可以想象一个倒霉的投资者,他观察到,在截至1968年12月31日的5年期内,某些类型的股票表现十分优异,他做了大量的“功课”——通过认真阅读报纸上报道的这些“快枪手”经理的耀眼成绩单,最终决定在1969年投身于股市的滚滚洪流中。在这种情况下,他们所投入的10 000美元将会缩减至4 260美元,这就是只关心5年期收益情况的结果。
如果这个倒霉的投资者能得到长期的收益数据(1964~2009年,这种投资策略的年收益率只有3.88%),他就会认识到仅仅依靠公司销售收入的年增长率来购买股票是多么糟糕的一种投资方式。此外,在所有股票中挑选每股收益增长百分比最高的前50只股票并进行投资,在1964年投入的10 000美元,到2009年年底只增长到57 631美元,而同样的10 000美元,如果投资到年复合收益率为5.57%的美国短期债券上,到2009年年底将增长至120 778美元。与之相反,如果这个投资者只是将这笔钱投入到某个指数(如标准普尔500指数)中,其年收益率将为9.46%,这10 000美元的投资到2009年年底将增长为639 114美元!如果投资于全部股票,收益将更为可观,每年的收益率为11.22%,这10 000美元的投资到2009年年底将增长至133万美元!
这不仅仅是一个学术方面的练习——人们在决定如何投资其退休基金时,其主要依据仅仅是某个基金或某种投资策略的最近表现。假设某人决定从1964年开始就使用这种投资策略为其退休进行储蓄,他在退休时的资金将严重不足。
如果20世纪60年代看起来有些久远,让我们来看一下相同因素在最近的表现——1995年1月1日~1999年12月31日的这个5年期。投资者常使用短期的投资结果预测未来,20世纪90年代末的股市疯狂为此提供了另一个解释。在这一期间,人们再一次陷入了癫狂状态,沉醉于那些高速增长的公司的美好前景之中,只是他们所追逐的公司的名字发生了变化,从宝丽来公司、Mohawk数据公司与Zimmer家居公司换成了Pet.com公司、网络货车(Webvan)公司及eToy.com公司等。因此,如果他们在1995年1月1日投资10 000美元,在所有股票中挑选每股收益增长百分比最髙的前50只股票并进行投资,到1999年12月31日,这笔投资将暴涨至45 539美元,年收益率为35.42%。这几乎是全部股票在同一时期内的年化收益率20.72%的两倍,10 000美元的投资到期末将增长为25 644美元。并且,与20世纪60年代非常相似,所有的新闻媒体、“专家”及普通的投资者都陷入了短期超高收益这一误区,将他们的股票投资于这些股票当中,其结果也和30年前的投资者一样,是灾难性的。在接下来的5年里,这50只每股收益增长百分比最髙的股票每年下跌20.72%,到2004年12月31日为止,他们所投入的10 000美元只剩下了3 132美元,总计损失69%,对任何为退休而进行储蓄的人来说,这一结局都是灾难性的。与之相反,投资于全部股票的投资组合,在这一5年期的年收益率为6.68%,10 000美元的投资将增长至13 818美元。毋庸多说,那些忘记历史的人注定要重蹈覆辙。
这一次不一样了
人们愿意相信现在和以前不一样了。现在,市场已经电脑化了,高频交易与大宗交易占据了主导地位,个人投资者消失了,取而代之的是规模巨大的共同基金与对冲基金,它们代替个人投资者进行投资。有些人认为这些投资专家所采用的决策机制与我们不同,并且认为,研究某一投资策略在20世纪50年代和20世纪60年代的业绩对于预测基金未来的业绩没有多大帮助。
但是,尽管我们坚信我们目前所处的环境是独一无二的,事实上,自从艾萨克·牛顿(他真是一位才华出众的人)在1720年的南海贸易公司泡沫中遭受重大损失以来,股市其实并未发生什么大的变化。牛顿哀叹道,他“可以计算出天体的运行规律,却算不出人类的疯狂”。在长期统计结果的基础上进行投资决策的关键在于:股票的价格仍然由人来决定。第3章中的图3-1与图3-2对南海公司的股价暴涨与20世纪90年代的纳斯达克市场泡沫进行了比较。只要人们的判断仍然受到恐惧、贪婪、希望和无知的左右,他们就会对股票进行错误的定价,而那些能够严格运用经时间验证的投资策略选股的投资者,会获得许多机会。牛顿遭受损失的原因在于,他被当时的癫狂气氛所感染,根据一个美妙的故事做出投资决策,却不考虑枯燥乏味的事实。股票的名字会发生变化,行业会发生更替,投资风格也可能不断发生变换,但决定一只股票能否投资的基本特征保持不变。
每个时期都有投资者热捧的股票,这类股票都有着最炫目的故事。20世纪20年代的投资者追捧的是所谓的“新纪元”行业(如无线电及电影公司),1921~1929年,投资者将道琼斯工业平均指数推升了497%。仅1928年,轻信的投资者就将无线电公司的股票从每股85美元推至420美元,他们唯一的依据就是希望这种新奇迹将彻底改变世界。在同一年里,投机者使华纳兄弟公司的股价上涨了962%——从每股3美元增长至138美元,其依据是有声电影及艾尔·乔生(Al Jolson)签署的一份新合同所引发的狂热。20世纪50年代,我们又看到一场相似的对新技术的追捧,1957~1959年,德州仪器公司股票的价格从每股16美元涨到194美元;其他的公司,如哈洛伊德–施乐公司(Haloid-Zerox)、仙童相机公司(Fairchild Camera)、宝丽来公司(Polaroid)及IBM的股票价格均在这一轮热潮中大幅上涨。看一下近期的情况,还记得20世纪90年代末期,所有网络公司的股价仅仅因为一次PPT演示及随之而来的空前热情就一飞冲天吗?
答案很简单,20世纪60年代及90年代的癫狂状态的出现其实很正常,它们只不过是一次长期牛市的终结,其结局是可以预测的。在这样的状态下,即使是最愚蠢的投资策略也会获得异常高的收益,结果是一败涂地。对收益进行长期的考察至关重要,原因在于,只有经过充足的时间才能发现被短期波动掩盖的基本关系,同时,这样做还有助于我们分析市场怎样对一系列的事件(如通货膨胀、股市崩盘、滞胀、衰退、战争、科学新发现等)做出反应。学习历史,才能更好地掌握未来。历史绝不会一成不变地重演,但同样类型的事件还会出现。在最近的一次投机泡沫中,那些将这一基本信息牢记于心的投资者,最有可能幸免于难。
在经历了灾难性的熊市之后,这一道理同样适用。在旷日持久的熊市之后,投资者的表现与在市场癫狂之后的表现相同,都表现出了非理性行为,在市场见底(或接近见底)之时,他们经常会大批地离开股票市场。当他们获得足够的信心,重返股市时,股市通常已经复苏好长时间了。那些在2009年中选择空仓的投资者,错过了50%~75%的利润,这让他们很难战胜市场。
我们总希望预测市场,但事实很清楚:在《福布斯》500富豪榜中,没有一个人是短线客(market timers),却有许许多多的投资者。
仅有实例证据是远远不够的
我们每天都会面对来自各方的投资建议,但很多都是缺乏证据的小道消息。很多时候,某个投资经理会举出一些股票作为其成功的例证,说明他们的投资业绩是多么的出类拔萃。可惜的是,这些经理刻意地回避了许多其他的股票,这些股票同样具有他们所推荐的特征,但表现不佳。行为学研究表明,股票市场中有一个常见错误,即从个别特例中归纳出结论,有证据表明,人们经常从他们的记忆中“抹去”那些表现不佳的投资操作。这让他们只对极少数表现非常好的股票印象深刻,对那些表现不佳的股票几乎没有印象。因此,我们必须考察整体的投资策略,而不只是个股的收益。通常,我们心里想的和实际做的往往是两回事,这两者之间存在着巨大的差别。
本书的目的在于,向读者介绍一种更科学、更系统的股票市场投资策略及投资组合管理方法。为做到这一点,我将不折不扣地贯彻那些严谨、科学的投资规则,这些规则主要包括以下一些内容。
1)明确的方法:所有的模型必须使用明确说明的规则,对于要检验的投资策略或投资规则,不能有丝毫的含混,对该投资策略也不应存在个人或特殊的理解。
2)投资规则要透明:必须对所检验的投资规则给予明确、公开的说明。这样,任何具备足够的时间、金钱、数据、设施及投资意愿的人都可以自己重复模型的结果。投资规则必须合理,并且不由数据推导而得出。
3)可靠性:使用同一规则、同一数据库,任何人都应当获得相同的结果。此外,结果必须可以持续相当长一段时间,绝不能通过短短的几年就推导出长期结论。
4)客观性:我一直尝试使用那些直观的、有逻辑的并且易于理解的规则,但这一规则在任何情况下都应该是客观的。它们与投资者的社会地位、经济状况及文化背景无关,而且不需要投资者有任何特殊的知识、信息和理解能力。
5)可靠的数据库:事后检验有很多困难,而数据的质量是其中最主要的问题。所有的规模庞大的历史数据都会包含许多误差。尽管标准普尔公司的“Compustat主动型研究”数据库及CRSP数据库可以称得上是事后检验的最优标准,但我们必须牢记,这两个数据库都有其局限性。毋庸置疑,数据库没有对某些股票的拆分进行相应调整,有些股票的错误账面值在好几年里都没有得到纠正,有些股票的盈利数字是错误的,而且未经任何修正,甚至有些股票的价格可能是31,但被错写成13,等等。对于任何检验股市投资策略的研究而言,这些问题都是存在的,必须对其加以足够的重视,当某一投资策略的业绩只是略微髙于市场平均收益时,更应如此。在本版书中,我们首次使用CRSP数据库,它所涵盖的证券的时间可以一直上溯至1926年。
注意,这些数据库存在的局限绝非小事,在你检查本书中的结论时,务必牢记这一点。在《投资学》杂志的2009年冬季刊上,爱德华F.麦考利发表了一篇题为《我们对美国的长期收益率到底了解多少》(The Myth of 1926:How Much Do We Know about Long-Term Returns on U.S.Stocks)的文章。在这篇文章里,麦考利扼要介绍了对不同投资策略进行事后检验时需要注意的几个地方。他指出,即便是CRSP这样规模巨大的数据库也会存在许多问题,这些问题有:
·时间段的限制(timeframe limitation):尽管CRSP的数据始于1926年,麦考利注意到,这一时间段并未包括“从覆盖范围上来看,50%的历史记录,还有交易历史接近200年、在美国交易的大盘股”。显然,始于1963年的Compustat月度数据,在数据的覆盖范围上存在着更大的局限性。
·不能覆盖所有交易中的股票:麦考利注意到,“在CRSP数据库所覆盖的时间段内,超过50%的在美国交易的主要股票未被包括在内,尤其是那些盘子较小、价值较高的股票”。
20世纪70年代末,Compustat数据库还纳入了许多小盘股,这有可能导致预测结果的向上偏误,因为许多新增股票仅仅是因为表现优异而被加入的。
因此,在分析各种风格的投资策略时,尽管这几个数据库是最好的,但你还要时刻牢记它们的局限性,并将分析结果与通过其他数据序列得到的结果进行比对。这些数据序列包括:由Dimson、Marsh及Staunton教授提供,在《投资收益百年史》一书中占据重要地位的全球收益数据序列、那些MSCI指数所涵盖的美国以外市场的数据,最终会被纳入美国的数据库(如价值线及Worldscope)之中。
可能存在的问题
对华尔街偏爱的投资策略进行的诸多研究都存在严重的问题,这些问题如下。
数据挖掘
从康涅狄格州的格林尼治到曼哈顿的中央火车站,乘特快列车大约需要40分钟时间。在这段时间内,你可以在车厢里左右张望,并且发现各种各样的在统计上显著的特征,这些特征与同车乘客有关。在这节车厢里可能有许多金发碧眼的女士,或有75%的乘客有着蓝色的眼睛,或是大多数乘客都出生在5月。然而,这些关系很可能只是偶然因素的结果,对于这节车厢前后的车厢就不一定成立了。当你试图对这些关系进行分析时,你实际上是在进行数据挖掘。你会找到一种统计关系,它对于某个数据组的拟合非常好,但无法拟合另一个数据组。正如统计学家曾经嘲讽过的那样,只要你对一组数据“拷打”足够长的时间,它们就会“承认”任何事情。因此,如果找到的关系不能从理论、经济、直觉或是常识上给出合理的解释,那么它很可能只是偶然的结果。从而,如果你发现某种投资策略要求你只能在星期三买入股票然后持有16个月半,这一定是数据挖掘的结果。确认超额收益是真实的最好方式,是在不同的时期(或不同的次周期)或不同的市场中(如欧洲国家)对它们进行测试。实际上,通过考察从CRSP数据库1926~1963年的数据中所得到的新结果,我们可以对前述的发现进行测试。我们使用MSCI EAFE数据库(欧洲、澳大利亚及远东地区)得到的研究成果表明,这一策略实现的超额收益率水平与在美国的结果比较接近。
我们运用的另一项技术是数据自举法(bootstrapping the data)。这一方法对我们所要测试的各种投资策略的全部结果进行随机重新抽样。我们运行100个随机选择的次周期,以确保全部选取的次周期与各种投资策略所展示的全部结果之间不出现较大的差异。通常来说,如果某种投资策略表现因素最好的10%与表现最差的10%的年化收益率之间存在较大的价差,我们就认为这种投资策略是有用处的,或是有预测能力的。在最近的83年里,最好的(最高的)6个月价格动量股票中最好的十分位(10%)的年收益率比最差的十分位(10%)的年收益率高出9.96个百分点,这一事实提供了非常有用的信息,可以极大地影响我们管理投资组合的方式。为消除这一方法中存在的所有抽样误差,我们对随机抽取的子样本进行一次测试,这可以确保无论我们分析的是哪组股票,这些十分位分组会有类似的年收益率价差。如果在每次数据自举法的测试中进行100次重复抽样,我们首先在事后测试中的所有可能的月度交易日中随机抽取50%的样本,对其他的50%舍弃不用。然后我们在这些日期的可用股票中随机抽取50%的样本,对其他的50%舍弃不用。这实际占了十分位分析初始样本总体的25%。我们对每种投资策略运行100次数据自举法,然后分析这个十分位的收益率价差。巧合的是,对我们的最好的投资策略而言,最好的十分位与最坏的十分位之间的收益率价差在这100次重复抽样中保持不变。换言之,对于6个月价格上涨因素(投资策略),不管你投资于哪组股票,只要你购买的是最好的价格动量的那组股票中最好的10%,你的表现就比较不错。如果我们发现,数据自举的结果差异较大,我们就会对这一结果缺乏信心,并且会研究是否有证据证明,在这一测试中存在着无意的数据挖掘偏差。
时间长度不足
在5~10年的期限内,任何投资策略的回报看起来都可能很光鲜。有无数的投资策略都有可能在某个阶段表现极佳,但在长期内的表现十分糟糕。在任一个特定的年份中,总会有某些稀奇古怪的投资策略获得成功。比方说,1996年,由股票代码中含有元音字母——A、E、I、O、U和Y的股票构成的股票组合比标准普尔500指数的收益率髙出11%,但这绝不意味着它是一个好的投资策略!这个例子只是说明了,在1996年里,该股票组合的收益率碰巧超过了标准普尔500指数。这一现象在学术上称为小样本偏差(small sample bias),那些只关注投资策略在近5年中的收益率,并预期它将在所有的5年期内都会成功的投资者就是犯了小样本偏差。某个策略在研究时所选的时间段越长,它在未来继续有效的可能性就越大。从统计上来说,来自大样本结果的可信程度总是比那些来自小样本的结果更可靠。
存活者偏差(survivorship bias)
许多研究并未将破产公司的股票包括在内,这就使其产生的研究结果产生向上的偏差。大批股票因公司破产或被兼并而被剔除出数据库。尽管大多数新的研究都包含一个由退市股票构成的板块,但许多早期的研究并未包括这类股票。
前视偏差(look-ahead bias)
许多研究都假设投资者拥有某些基本信息,但他们实际得不到这些信息。例如,研究人员经常假设投资者在1月时就掌握了年度盈利数据,但实际上,投资者只有在3月以后才能得到这些数据。这也使研究所得到的结论出现向上的偏差。
游戏的规则
我试图通过采用下列方法来改正上述问题。
1.总体研究样本
我们将在本书的这一版中使用两个数据库——标准普尔公司的Compustat主动研究型数据库(数据选取时间为1963~2009年)及证券价格研究中心(CRSP)的数据库(数据选取时间为1926~2009年)。目前,标准普尔公司的Compustat数据库涵盖了北美约13 000家公司的股票,并包含有绝大多数交易证券的金融及统计信息的历史记录——年度数据从1950年开始统计,季度数据从1963年开始统计。CRSP数据库提供了美国公司的每日活动、价格、成交量、收益及那些将纽约证券交易所(NYSE)、纳斯达克(Nasdaq)及美国证券交易所(Amex)作为主要上市地的流通中的股份信息。Compustat与CRSP数据库都有专门的研究文件,包含有起初在交易所上市,后因为合并、破产或一些其他原因退市的股票数据。这样处理,避免了当破产公司因不再存续而被剔除出研究报告时,出现的存活者偏差。
我无意夸大检验投资策略长期表现的重要性。正如任何在20世纪60年代与20世纪90年代中进行的研究都会钟情于成长型股票,任何在20世纪七八十年代中进行的研究也都会找到支持价值型投资的强有力证据。华尔街的投资风格也不断变换,因此,研究的时间跨度越长,结果的参考价值也就越大。从统计学的角度来看,最怪异的结论往往来自最小的样本。与小样本相比,大样本提供的结论总是优于小样本。有些养老金顾问运用一种被称为可靠性数学的统计学分支学科,用过去的收益数据预测未来,他们发现,要想准确地预测未来,你最少需要14个收益期间的历史记录。
2.股票的总市值
除了某些专门测试小盘股的研究之外,我仅把股票分成两个不同类别。第一类仅包括那些市值超过2亿美元的股票(已经经过通货膨胀率调整),在全书中,我们将这一类股票统称为“所有股票”。表4-1展示了怎样根据通货膨胀水平求出各年的最低市值。在本书中我们将继续使用该表中列出的各年数字,以后再对本书进行修订时将根据向上调整的通货膨胀率数字计算新的调整值。第二类则包括那些规模较大、知名度较高的股票,其市值应高于数据库中股票的平均水平(通常为数据库中按市值排列在前17%的股票)。在全书中,我们将这一类股票统称为“大盘股”。表4-2显示了市值超过数据库中股票平均水平的股票数量。
表4-1 经通货膨胀调整后的2亿美元市值
表4-2 市值高于数据库中股票平均水平的股票数量
不管在哪种情况下,我都不考虑数据库中市值最小的股票。例如,2009年年末,我们的数据库中共有6 705只股票,其中有2 555只股票被排除,因为它们的市值低于经通胀膨胀调整后的2亿美元这一最低市值标准。在同一年里,只有651只股票的市值超过了数据库中股票的平均水平。对于那些包括在Compustat数据库中,但是没有市值、存在重复问题及由共同基金所持有的股票,我们也同样予以剔除。
我在1995年最初选定的市值为1.5亿美元(现在经通货膨胀调整为2亿美元),这一数值是在咨询了华尔街几家较大经纪公司的交易员之后确定的。他们认为,在1995年时(我撰写本书第1版时)要将1亿美元的资金投资于一只大型投资组合,股票市值的最低标准应为1.5亿美元。我使用这样一个数值的目的是避免将微型股票包括在内,并且能将注意力集中在专业投资者可以购买,同时又不会遇到流动性问题的那些股票上。通货膨胀会造成很大的影响:在1963年时仅为2 940万美元的市值,相当于2009年的2亿美元。而同样的2亿美元,折算到1926年,其市值大约等于1 680万美元。
将微型股票剔除,会极大地降低我们研究的某些因素的收益情况。在将本书中起重要作用的某些因素与许多其他学术研究(包含有微型股票)进行比较时,剔除微型股票会使这些因素处于不利的位置。我们已经发现,在将微型股票剔除后,我们的分析结果明显低于那些包含微型股票的研究结果。但我认为,要让我们的投资组合更好地复制现实世界,这样做是适当的,也是符合事实的。微型股票实际上缺乏交易流动性,一手大买单就会让其价格一飞冲天。因此,尽管我们可以假设能按照数据库列出的价格买卖股票,但我认为将微型股票包括进来很容易出问题,也会让我们的研究结果出现不必要的向上偏差。
3.避免前视偏差
我们只使用公开可用的月度信息。为确保我们所选择的股票都是根据公开的、已经为投资者熟知的信息,我们对季度数据安排3个月的时滞期,为年度数据安排6个月的时滞期。尽管这样安排会让这些数据显得陈旧,但为避免前视偏差,这样做是有必要的。
使用早期数据有一个潜在的问题,即Compustat数据库是不断变化的。如表4-2所示,标准普尔公司不断扩展其Compustat数据库,逐步加入了许多规模较小的股票,其历史记录最长不超过5年。并且,这类股票恰恰是因为其成功而被加入到数据库中的,前视偏差也因此成为一个真正需要考虑的问题。尽管本书不可避免地会出现前视偏差,但我认为,由于我们已经剔除了那些规模最小的股票,这一问题已大有改观。
4.调整方法
在本书前3版中,所有的投资组合都成立于各个公历年的12月31日,然后持有一年。尽管这是一种有用的方法,对1950~1963年这段时期尤其如此,因为在这一时期中只有年度数据可用,但是这种方法存在两个问题。首先,公司现在已经按季度披露财务报表,在任一给定年份中,一年只构建一次投资组合忽略了这一期间的大量新信息。同样的模型将在全年里根据不断变化的季度财务报表信息选择大量的证券。其次,仅仅在12月中构建投资组合,所产生的结果会产生季节性偏差。现实情况是,投资者会在一年里持续进行投资,而不只是在12月31日投资。为解决这两个问题,更好地理解我们所研究的因素或投资策略,现在将所有的结果综合在一起。要做到这一点,我们在每年为每个投资策略构建12个相互独立的投资组合,每个月构建一个投资组合,然后将这12个月的投资组合的收益进行平均,求出我们的投资组合的收益率。各个月的投资组合的调整期仍然为1年。动态调整(综合的事后检验)的结果优于单个月份的分析,这是因为它抓住了某个因素的本质特征,而不是单个数据点。如果某个因素12月的序列表现碰巧优于其他月份的表现,你对这个因素的有效性的看法可能会不完整(或不正确)。相反,如果某个因素12月的序列表现较差,即使所有其他月的表现都非常好,你仍有可能错过一个非常优秀的因素。
来看一下表4-3,它是我们为考察综合的事后检验的好处而于2009年年初构建的。这张表展示了从所有市盈率最低的股票中购入排名前10%股票的不同结果——差别巨大!如果一个投资者投资了1月序列,其平均年复合收益率为19.03%,在1962年12月投资的10 000美元将在2009年12月增至3 070万美元,而如果一个投资者投资了3月序列(还是从所有市盈率最低的股票中购入排名前10%的股票),其平均年复合收益率为13.81%,在1962年12月时投资的10 000美元将在2009年12月只能增至390万美元,差距接近10倍。实际上,从所有市盈率最低的股票中购入排名前10%股票的投资组合所产生的相对于所有股票的超额收益率差别甚大,从3月序列最低的4.73%到1月序列最高的9.91%。此外,收益率超过股票总体的月度基本比率也存在差异。那些不对其他数据点进行测试,只使用单一数据点(如12月序列)的测试无法告诉我们低市盈率的股票组合在其他月究竟表现如何。使用综合的事后检验,你能更好地理解所分析的因素的真实基本比率。并且,要注意的是,千万不能这么想:“我只能在1月投资,因为在1962~2009年中,1月是在所有低市盈率股票调整后收益中表现最好的。”因为表现最好的月通常会随着时间的变化而变化。如果考察1999年1月1日~2008年12月31日的这个10年期,如表4-4所示,我们会发现,最好的表现出现在9月,而1月的表现则沦为中游。
表4-3 统计摘要:低市盈率股票前10%的投资组合(1962年12月~2009年12月的收益率,各月份按收益率排序)
表4-4 统计摘要:低市盈率股票前10%的投资组合(1999年12月~2008年12月的收益率,各月份按收益率排序)
我们还发现月度综合结果的基本比率有所提高。这是因为,12月序列现在只占整个投资组合的1/12。事后检验表明,每年只在12月调整一次的策略或因素有可能高估或低估这一策略或因素的有效性,这会让我们在选择最好的投资因素时犯错误。
例如,假如构建于12月、每年调整一次的低市盈率投资组合的表现低于其他指标值,我们就不会将这一指标作为我们投资策略的最优选择。然而,我们已知的事实证明,当我们按月份构建投资组合时,价格/动量这一指标的表现非常好。
相反,当我们每个月构建一个投资组合,每年构建12个投资组合时,我们就能更加深入地理解某个投资策略或因素的运作方式。毕竟这些因素或策略与信息有关,而信息在一年里是不断变化的。我们仅在12月构建投资组合,忽略了其他11个月的信息。如果把全年的信息都包括进来,我们就可以知道哪个因素的表现最好,而不用考虑初始投资及随后调整的具体时机。
所有的投资策略都是每年调整一次,股票是等权重投资的,没有对贝塔值、行业及其他变量进行调整。投资组合也可以纳入那些包含Compustat数据库中的外国股票(表现为美国存托凭证ADR的形式)。
本书的这一版还包括了取自月度数据的风险统计数据。通过这些数据,我们可以重点研究下列问题,如投资策略有良好表现的频率,最差的情况是什么,某个投资策略的回收期有多长等。
假设已构建投资组合在这一年内并不进行交易,只有一种情况例外——如果在投资组合正式调整之前,公司破产或被收购,我们会将出售这只股票的收入按比例地投入到投资组合剩余的股票当中。这对我们得到的结果或许会有一些轻微的影响,因为厌恶交易型投资策略会因此受益,但我认为,一旦将交易成本考虑进去,许多表现优异的投资策略就会变得十分平庸。我还检验了投资组合的年收益率情况,并将那些极端收益(或数据)的股票剔除出投资组合,因为这与外部信息不一致。
在现实生活中,我们列出了6个“危险信号”,提醒我们将某只股票剔除出投资组合,更换一只满足我们投资策略标准的新股票。这些危险信号如下。
1)如果一家公司无法满足《萨班斯-奥克斯利法案》所要求的财务标准,我们会将这只股票剔除出投资组合。
2)如果一家公司因舞弊而被联邦政府处罚,我们会将这只股票剔除出投资组合。
3)如果一家公司对其在构建投资组合时承诺的财务数据进行修订,我们会将这只股票剔除出投资组合。
4)如果一家公司收到来自第三方公司的收购要约,而该公司的股价变化高于收购报价的95%,我们会将这只股票剔除出投资组合。
5)如果一家公司的股价与其在构建投资组合时相比下跌了50%,并且处于所有股票在12个月之内最低价格的前10%这一价格区间内,我们会将这只股票剔除出投资组合。
6)如果基于股息的投资策略组合中的某只股票削减股息50%以上,我们会将这只股票剔除出投资组合。
我还对每种策略的绝对收益及经风险调整后的收益进行了比较,并分析了每种投资策略的贝塔值。从理论角度来说,贝塔值衡量的是某个证券或证券投资组合的业绩与市场总体业绩的相关程度。某个证券或证券投资组合的贝塔值为1,这表明其风险与收益情况和市场总体的风险与收益情况相类似;如果某个证券或证券投资组合的贝塔值为1.4,这意味着其风险与收益均高于市场总体的风险与收益。经风险调整后的收益考虑到了某个投资组合的波动性(用该组合收益率的标准差衡量),而不只是考虑其绝对收益率。一般来说,与一个年收益为16%、标准差为30%的投资组合相比,投资者更偏好年收益为15%、标准差为20%的投资组合。收益率高出1%的这一优势,并不能抵消风险波动所带来的恐惧与担心。在计算收益/风险的指标时,我使用著名的夏普比率。这一比率越高,经风险调整后的收益也就越高。要计算夏普比率,只需要计算某个投资策略的平均收益率,减去无风险利率(我们使用5%的无风险利率,这一常数可以让我们在所有的子周期中使用同一无风险利率对各种投资策略进行比较),然后再用这一差值除以收益率的标准差。夏普比率的重要性在于其反映了风险。表4-5提供了一个案例,来说明某个投资策略在绝对收益上超过了标准普尔500指数,但是其经风险调整后的收益赶不上标准普尔500指数。一般来说,你只会使用那些无论是绝对收益还是经风险调整后的收益都超过基准指标的投资策略。我还展示了下行风险(downside risk)——用低于零的半标准差来衡量这一风险,即用这一指标衡量某一投资策略在股票价格下跌时的风险。我认为这是一种更准确的风险测度方式。除此之外,在介绍了夏普比率之后,我们还要介绍索蒂诺比率(Sortino ratio),这一比率是对夏普比率的修正,它只关注下行风险。要计算索蒂诺比率,需要用投资组合的收益率减去必要收益率(一个常数,如10%),再用这一差值除以下行风险。
表4-5 确定某一投资策略的经风险调整的收益率
注:1.标准普尔500指数的风险调整后收益率等于7.76%,除以19.43%,或0.4。
2.投资策略的风险调整后收益率等于8.29%,除以20.83%,或0.39。
5.最低预期收益与最高预期收益
此外,在和所有投资策略有关的信息总结部分,除在过去52年中该投资策略所实际获得的最高收益与最低收益数据之外,我还提供了它的最高和最低预期收益。这一信息极其有用,因为投资者可以了解每个投资策略可能遭受的最大损失,然后决定是否能够承受这一风险。
6.概要统计
在本书的这一版中,我为每种投资策略提供了大量的测度方式,这是之前的各版所没有的。我使用晨星公司的Encorr分析师软件生成了全部概要统计(summary statistics)信息。除了之前介绍过的概念之外,概要统计结果报告还包括如下内容。
·数学平均值:在统计期内的收益率的平均值。
·几何平均值:在统计期内的年复合平均收益率。
·收益的中值:位于所有收益率中间的收益率,50%的收益率高于该值,50%的收益率低于该值。
·收益的标准差:在某个整体数据序列中,所观测到的数据序列对其平均值的偏离程度。收益的标准差越大,投资策略也就越有“风险”。但是,由于全部观测值的大约70%为正值,我认为,使用这种方式测量某个投资组合的整体风险有可能造成误导。毕竟,如果股票的走势和你预期的相同时,你会希望这“风险”越高越好。因此,我更倾向于使用以下指标。
·收益率低于零的半标准差(下行风险):我认为这一指标可以更好地测度某个投资策略的风险,因为它专注于所有低于零收益的左侧观测值代表的那一部分风险。半标准差实际关注的是下行风险,在股票价格下跌时,这一数值越小,投资策略的风险也就越小。
·T统计量:这一指标衡量的是统计值可以归结为偶然性的可能性有多大。通常来说,T统计量的值为+/-1.96(观测值至少要有20个)意味着统计值在95%的置信区间具有统计上的显著性。T统计量越高,观测值归结为偶然性的可能就越小。你可以通过所分析时期的一系列随机生成数据来检验这一指标。例如,在1963~2009年这一时期内产生的一系列随机指标的T统计量是-1.02。
·所选取投资策略的投资组合的跟踪误差:跟踪误差测度的是一个投资组合的收益与作为基准的一个指数或投资组合之间联系的紧密程度。跟踪误差越大,投资组合与基准的相似程度也就越低。
7.由25~50只股票构成的投资组合与10%
所有的多因素模型都包含25~50只股票。对于所有的单因素模型,我们将最好的10%与最差的10%进行比较。
8.投资纪律
我检验的是投资纪律,而不是交易策略。我的研究结果表明,股票总体市场并非完全有效。投资者只要在长期中严格遵循优秀的投资策略,就能够实现高于市场平均水平的收益率。简单、严格地遵循投资策略,例如,买入道琼斯工业平均指数中股息率最高的10只股票,在过去75年中获得了成功,因为这样做不受市场情绪的影响,而且迫使投资者在某公司陷入困境时仍然坚持买入其股票。在博帕尔事件之后,没有人愿意买入联合碳化物公司(Union Carbide)的股票,在瓦尔迪兹(Valdez)漏油事件之后,没有人对埃克森公司(Exxon)的股票感兴趣,但此时恰恰是最好的买入时机。
9.成本
我们的研究并没有考虑交易成本与买卖价差等因素。每位读者面临着不同的交易成本,交易额成百上千万美元的机构投资者的交易成本大大低于交易零星股票的个人投资者。因此,每一位投资者都可以根据适当的交易成本对原始数据或投资策略进行检验。然而,自从本书第1版在1996年出版以来,网络经济公司(Online broker)已经大大降低了个人投资者的股票交易成本。在许多情况下,个人投资者只须支付7美元的固定交易费用,即可买卖任何数量的股票。像Sharebuilder.com与FolioInvesting.com等公司还提供这样的服务,只要支付一笔固定数量的年费,你就可以通过这些公司在一年内无限次地购买股票。和过去相比,这种变化使个人投资者可以以更低的成本进行大宗交易,因为他们的交易成本已经十分接近于大型机构投资者的成本。
至于买卖价差的损益情况,哥伦比亚大学商学院的查尔斯M.琼斯在2002年5月发表了一篇题为《一个世纪以来的股票市场的交易成本及流动性》(A Century of Stock Market Liquidity and Trading Costs)的杰出论文。琼斯在这篇论文中发现,在考察道琼斯工业平均指数中所包含的30只股票(它们应该是美国交易所中最具流动性的股票)时:“令人惊讶的是,在20世纪10年代与20世纪20年代之间的相当长一段时期之内,道琼斯股票的买卖价差一直维持在0.6%的水平上,这一水平在20世纪50年代、20世纪80年代中也没有发生大的变化。在最近的20年中,买卖价差大幅度下降。”在这篇论文中,琼斯列举了一幅图表,说明这些股票的买卖价差在21世纪初已经下降至0.2%。这说明,即使是美国交易所中最具流动性的股票,一直到20世纪80年代,其买卖价差也一直维持在0.6%左右。那些规模更小的公司的股票买卖价差显然更高。因此,当你希望在现实世界中利用20世纪60~80年代之间的数据来实施这些投资策略时,你最好是减去1%的盈利(或是加上1%的损失)。目前,奥肖内西资产管理公司的交易员发现,小盘股的买卖价差平均为0.5%,而大盘股的买卖价差平均为0.15%。
接下来,我们来看一下对各种投资策略所做的检验。我们首先对不同市值股票的收益情况进行回顾,然后考察单因素和多因素组合的收益。