Local EPUB Text
第7章 飓风里行船只往后看
未知
第7章 飓风里行船只往后看
川妹子发现了新大陆。
自从认识西门以后,她对任何量化的东西都很感兴趣。西门虽说是满腹经纶,但是从来不会给川妹子的热情泼冷水。不仅如此,他一般都是很鼓励川妹子的。
很多个傍晚,他们两个一起坐下来研究川妹子记录的各种数据,都是关于她见到的投资名人,西门趁机给她介绍很多统计的概念,更重要的是给她说统计数字后面所掩盖的问题。所以川妹子也学会了西门常说的一句英文口头禅:“谎言有三种:谎言、该死的谎言和统计数字。”她知道了这话最先应该是英国首相狄斯累利说的,马克·吐温后来的引用使它十分出名。比如,川妹子知道了平均值可能隐藏了巨大的不均,但是用来反映不均情况的标准差则常常对肥尾估计不足,人们通常说因为甲和乙的关联系数高所以甲和乙有因果关系也是没有道理的,而且,关联系数本身就很容易受到一些因素的影响(比如肥尾),所以算出来的数字可能毫无意义,等等。这只不过是统计学的入门概念,川妹子慢慢开始迷上这个学科了,西门建议她报名参加网上大学的课程,川妹子准备去做。西门教她如何使用网上免费的一些统计工具,川妹子把她的那些数据上传到网站,按几个按键,就能得到很多的分析结果。试了几次不同的方法,川妹子才发现这些复杂的方法能从她的简单数据里面发现那样多的规律!每到这些时候,他们两个总是比赛谁先说:“谎言有三种:谎言、该死的谎言和统计数字。”
川妹子也开始琢磨用量化的方法来改进她的主要是靠小道消息的炒股方法。有一天,她神秘地对西门说:“我找到了!”
“找到什么了?”西门笑眯眯地问。
“常胜不败的投资秘诀,”川妹子说。
“嗯。那可千万不能告诉我,否则我也去模仿,你的秘诀就会失灵的。”
“我偏要告诉你嘛。我每个月都买入上个月表现第二好的行业里面表现第二好的股票,持货一个月,下个月再调整。因为我觉得表现最好的行业和股票已经被人炒高了,所以追进去肯定是死路一条。但是第二好的股票正好可以借着第一好的冲劲儿。你看跑长跑的,很多时候都是紧紧跟着领先的那个人最后赢。我已经试了三个月,每个月都赚钱。”
“哦,不错呀!”西门说。
25倍标准差事件
2007年7、8月间,量化基金遭到“血洗”,连平常保持沉默的西蒙斯也不得不给投资人写信解释情况。损失最大的基金集中在统计套利这种策略上,很多这类基金同时出现高额亏损,这是比较罕见的。通常即便在市场对某种策略不利的时候,因为各种不同的基金使用的同类策略会各不相同,所以亏损的程度也都会不同。但这一次几乎所有的统计套利基金都赔得很惨。摩根士丹利的量化基金据说在一天之内赔了超过3.9亿美元,远远超过风险控制的下限。高盛财务总监说连续数日出现25倍标准差的市场价格变化,高盛的两只以量化为主的基金8月分别亏损了23%和30%。有些人惊呼:这是量化基金百年一遇的风暴。也有一位教授冷静地说:“25倍标准差的市场价格变化?宇宙的年龄都不够我们观测到16倍标准差的事件呢!”
很多人认为,这个现象的出现正是因为过多的资金在追随同一个策略,超出了市场的容量。而在退出的过程中,大家都争相冲向大门,所以使情况进一步恶化。虽说复兴技术公司管理的机构投资人股票基金所受到的亏损小于很多竞争对手的亏损,但是也有人评论说即便是天下最聪明的头脑也无法对抗变化莫测的市场,而长期资本管理就是前车之鉴。
正是因为西蒙斯过去的成功,很多量化基金纷纷效仿复兴技术的各种策略,最后导致它们的头寸很相似。比如,2007年6月,根据各大基金给美国证交会上报的文件,复兴技术的机构投资人股票基金的前10大股票部位里面有4只股票和另一个专门从事量化投资的基金重叠。随着当时美国次贷问题的恶化,许多与房屋相关的行业的股票、债券受到影响,按揭证券化资产的价格下跌,给对冲基金贷了很多钱的银行开始要求收回贷款,并且要求对冲基金增加抵押资产,这使得有些量化基金不得不平仓止损。但是因为它们的部位相似,杠杆通常很高,一家开始平仓会引发连锁反应,使那些被做空的股票价格螺旋上升,那些被做多的股票价格螺旋下降。
这也说明了一个问题:股票被统计套利盯上本身已经变成了一个风险因素,但是统计套利的复杂模型则没有考虑到这一点。
在最近5年里,过去采取超短线高频统计套利策略的基金,包括复兴技术和DE肖尔公司开始使用比较长线的模型,主要是为了增加交易容量,减少流动性风险。但是,使用传统比较长线的股票多空策略的基金开始使用比较短线的模型,因为它们的技术能力在提高,这样做也是为了使风险多元化。多空策略基金的数量也大幅度增加。全球很多市场上,共同基金纷纷推出了一类新的基金产品,叫130∶30基金,这类基金可以做空30%的仓位,做多130%,从而保持共同基金净杠杆最多不超过100%的限制,但是同时又介入了对冲基金的领地:股票多空策略。所有的这些策略,虽说细节各异但都是按照马科维茨的理论来构建投资组合的,采用的历史数据大同小异,所以这些林林总总的基金持货相近不足为奇。即便是那些按照宏观方法投资的基金也常常会采用类似的理论来构建投资组合,所以当小的波动出现,庞大的人流一起冲向大门时,很多基金会损失惨重。
警钟还是丧钟
那这是不是量化投资的丧钟呢?
前面提到过的高盛量化基金的创始人之一,后来另立门户单干的量化基金管理人阿斯尼斯在给投资人的信中写道:“有时候我会听到人们用很概括的话说:‘(看,这正说明电脑模型是要赔钱的。’这句话没有错,电脑模型赔了钱。没有一个永远不赔钱的电脑模型。最近的事件并不能说明模型出了问题,而只是说明某个交易策略过分拥挤。在过去,很多量化的和非量化的投资策略也出现过类似的问题,当大家都挤着要出门的时候免不了会有伤痛。”
对于统计套利策略的相似性,一位复兴技术的管理人员在接受采访时说:“当你认为自己找到了灵丹妙药的时候,别人可能也找到了。”但是他说各种统计套利策略之间的关联系数并不像媒体报道的那样高,只有15%左右,问题的关键是很多基金采取很高的杠杆,新的基金又在不断加入,所以这种策略整体风险增高。当市场处在非常时期,荧光屏上的价格不再有什么意义,因为流动性没有了。压水花的技术再好,也需要水呀。
我们认为,不能因为统计套利策略的失败而将所有的量化投资行业一棍子打死。随着这个行业的发展,现在很多量化投资技术不再是复兴技术、大本营或者DE肖尔的专利,很多共同基金也使用各种量化投资方法,当然共同基金一般不会用很高的杠杆或者用风险比较高的策略。比较常见的用于共同基金的量化技术包括中长期的趋势追踪、依靠公式来选股的价值投资模型(还记得我们前面说过的法玛回报因子吧)、使用布莱克-舒尔斯-默顿方法的保本技术模型(即上一章说过的投资组合保险)、使用马科维茨的方法来自动进行行业间的配置和资产配置调整技术,等等。
最近一两年,量化投资经常出现在报纸上,但一般都是在负面的报道中,人们把从市场波动性到股票沽空的压力再到整个金融危机都归咎于量化投资,这当然是有失公允的。很多使用量化投资的共同基金并没有给市场带来任何破坏,而是为投资人提供了进一步多元化的选择,所以是好事。当从事统计套利的量化基金遭到血洗的时候,有人统计,美国25家投资美股的量化共同基金中有19家回报好于标准普尔。共同基金的低杠杆或者无杠杆当然是这些量化投资风险较低的一个重要原因,另外,对冲基金通常使用量化技术来积极交易,而共同基金则使用量化技术来寻找比较长期的机会,这也是它们风险不同的一个原因。
数据挖掘
除了跟算法交易或者高频交易关系更为紧密的市场容量这个问题之外,量化投资还有另外一个潜在的致命问题,那就是数据挖掘。
数据挖掘指的是从大量的数据中发现潜在的、不明显的有用信息、模式和趋势的方法,一般通过计算机完成。在金融行业里面数据挖掘的目的是通过过去来预测未来,数据挖掘的方法现在被用在很多其他行业,如:消费者习惯、犯罪调查、药物分析、基因研究等。谷歌公司在你的搜索或者电邮页面放上相对应的广告,也是一种数据挖掘。
其实,数据发掘也没有什么神秘的,人们研究数据从中寻找规律的行为跟人类使用数据来记录信息的历史一样长。这种方法是在最近30年才有了惊人的发展,原因当然是电脑技术的发展和数据量的大幅提高(而且使用数据的方便程度提高、成本大幅度下降)。将本来是人做的事情交给电脑来做,效率的提高是肯定的。但是随之出现的一个问题就是过度的挖掘,所以有时候人们提到数据挖掘的时候常常是有贬义的味道:如果你盯着一个东西看久了的话,你就会看到本来不存在的规律。或者套用一句统计学家常说的话:“如果你把数据折磨到一定程度,数据什么都会招的”。
英文里面为了区分贬义的数据挖掘,常常将那类有些过头、缺乏依据的做法叫“数据窥视”。维基百科上有一个关于数据窥视的例子,随便找367个人,其中肯定有两个人的出生月份和日子相同,比如张三和李四,都是3月17日出生,数据窥视者就可能会进一步去“挖掘”张三和李四的相似点:老婆姓什么?爱犬叫什么?女儿是不是弹钢琴?等等。掘地三尺,总会发现他们两个有共同点,比如小学3年级都留过一次级,数据窥视者的结论就是:3月17日出生的人小学3年级留级的可能性比较大。
“牛”市
在量化数据分析中有一个很容易犯的错误是数据窥视,将巧合当成规律。牛头来自维基媒体。
当然我们很容易看出这个结论的可笑之处,但是量化投资的很多分析方法所得出的结论都可能犯同样的错误,不过要发现那些错误就不那样容易了,很多投资人或者基金管理人都是在赔了很多钱之后才发现他们成了数据窥视的受害者。
随便翻开任何一本量化投资或者技术分析的书,或者翻开银行以及基金的销售材料,里面都有很多这样或者那样的模型在过去多少年间是如何盈利的图表,这类图表一般都是一条比较平滑的、向上的曲线,代表着你的1元钱的投资如何连蹦带跳变成十元或者百元的,就像大奖章的历史投资回报,那也是一条比较平滑、向上的曲线。那么是不是你如果照本宣科、将书上的策略拿到实际中去投资也能变成巨富呢?或者,你将钱投到银行、基金的很吸引人的销售材料所说的产品里面就能一本万利呢?当然这是有可能的——就像你今天出门的时候被一麻袋钱绊了个跟头一样,这也是有可能的,但可能性都不大。西蒙斯的历史回报曲线是真实的1美元在历史上是如何变成600美元的,而绝大部分的书里面或者销售材料中的曲线则是模拟出来的。模拟不是欺骗:如果历史上你真是按照书里面所说的模型投资的话,如果模型考虑到了各种交易成本的话,你的1美元钱的确能变成图上画的几百美元、几千美元。关键的字眼是“历史上”:如果时光能够倒流,你突然回到几年前,那时候的书本上有着千千万万个不同的赚钱模型,那时候银行或者基金的销售材料也有很多回报诱人的产品,你会选这个后来能一鸣惊人的产品吗?如果你知道后面将会出现的结果,你当然会一口认定这个模型。可是当年你不知道的时候呢?今天你面前只有这个过去回报很好的模型来勾引你的原因是:模型的设计人已经根据后来出现的情况把那些你过去可能选择的但是会赔钱的千千万万个模型都扔掉了。换句话说,这个模型只适用于设计人所选择的367个人中的张三和李四,模型的结论很可能是通过数据窥视得出来的。
量化分析的过程其实就是通过过去的数据窥视将来的过程,所以数据窥视的问题是不可避免的但是这并不意味着各种通过挖掘或者窥视得到的结论是一样有效或者无效的。统计学里面有各种工具可以帮助设计者减少窥视的可能性,这里我们就不详细说了,把它留作将来西门解释给川妹子的话题之一吧。对于量化基金的管理人、那些想要设计量化投资模型的人和各类想要投资量化产品的投资者来说,这是他们首先要处理的最重要的问题。凭借判断来投资的方法没有这个问题,因为靠的都是管理人的判断,所以你要看管理人过去的成绩(投资实证研究的结果对基金管理人过去的表现和将来表现的关系也没有定论,大致说,共同基金过去的表现基本和未来没有关系,对冲基金有一些正面的关系。),但是量化投资方法则可以算出各种历史的“可能”回报,所以窥视的问题到处都是。
也许正是因为量化基金能够提供各种历史数据来支持,所以过去20年中它日益被投资者认同,有的投资人还觉得跟那些交易员出身、骄傲自大的判断型管理人相比,量化基金可能更稳妥一些。但是我们不能忘记量化投资的潜在问题:它依赖的是历史数据和历史关系,而历史,既可能重复,也可能更改。
本书由“ePUBw.COM”整理,ePUBw.COM 提供最新最全的优质电子书下载!!!