学习进度

0%

阅读时长

未满 1 分钟

最近阅读:未开始阅读

核心概念

待提炼

章节学习

  • 1

    前言

    未知 前言 一年多以前,我在伦敦出差,接到一个电话。越洋长途的另一端是我认识很多年的一个熟人。信号不太好,他的每句话都像要停顿几秒:“哎,不说闲话了,我要问您一个关于工作的问题,您不要告诉别人说我问过这个问题了,行吗?” 不说闲话?我们认识这样久,常常电话聊天,我路过北京或者他来香港出差的时候也总在一起吃饭,说的可都是闲话。我知道他也在金融机构工作,和我的工

    待学习
    开始阅读
  • 2

    第1章 只赚不赔的好买卖

    未知 第1章 只赚不赔的好买卖 三个白胡子老头儿——其中两个将近80岁,出生时间相差不到20天,另外一个稍微年轻一些,也70岁出头——站在北京首都机场的候机楼里为他们中的哪一个最牛而争吵不休。后来他们决定到旁边的小书店里面请售货员小姐评判。售货员小姐是个四川妹子。第一个老头儿,眼泡肿肿的,鹰钩鼻子,虽说脸上挂着笑容,但一看就是个斗士,把原委说清楚了之后还没有

    待学习
    开始阅读
  • 3

    第2章 四千六百个诺贝尔奖

    未知 第2章 四千六百个诺贝尔奖 北京首都机场候机楼小书店里的川妹子自从看见了投资领域的三个最有名的人之后更加积极攻读各种投资书籍,并且上网“谷歌”了金融投资行业各路神仙的模样,她上班的时候天天往门外望,看看今天发现的是谁。不用说,当今的北京吸引着全球各路顶尖的投资高手,所以川妹子天天都有收获。 这一天她又看见了三个人。也都是白胡子老头,60多岁,比上一次的

    待学习
    开始阅读
  • 4

    第3章 我心里埋藏着小秘密

    未知 第3章 我心里埋藏着小秘密 川妹子自从见了西蒙斯之后总是忘不了这个温文尔雅的老头儿。其中的主要原因不是他赚多少钱,而是她对他的一无所知。人总是这样。川妹子知道巴菲特爱吃什么,他主要助手的名字,知道索罗斯爱开什么车,有什么口头禅,但是关于这个能睡在上面的“席梦思”,她什么都不知道。于是川妹子开始留意关于西蒙斯老头儿的各种消息——现在有谷歌,就算老头儿再低

    待学习
    开始阅读
  • 5

    第4章 股价上的风景

    未知 第4章 股价上的风景 川妹子有男朋友了,媒人不能不说是西蒙斯。 那天川妹子听到有人问西蒙斯的书,一抬头,看到一个青年男子,二十七八岁的样子,一脸朝气。她的心里咯噔一下,这个人,怎么以前好像见过?但是她实在想不起。她想起了一首很老的歌,又觉得好笑。她对青年人说:“对不起,没有。”那个人仔细看了她一眼,对着她善意地笑笑,说:“我猜也没有,只是想试试。”他转

    待学习
    开始阅读
  • 6

    第5章 趋势是你的朋友和敌人

    未知 第5章 趋势是你的朋友和敌人 川妹子突然对一切量化的东西兴致盎然。当然,这一半是因为她本身是个聪明好学的姑娘,另一半是因为西门的影响,人家是个研究量化问题的专家,而且很愿意跟川妹子讲解各种问题,最后还有一半,不消说是我们这本书的需要——一本关于量化的书,什么事情都要量化起来才清楚嘛。 川妹子仍然持续着她的爱好,在上班的时间偷偷从书店瞄出去,看首都机场来

    待学习
    开始阅读
  • 7

    第6章 更高、更强、更快

    未知 第6章 更高、更强、更快 川妹子有时候炒股,小打小闹。但是专门研究投资的西门从来不炒。川妹子问他为什么,西门总是说他拿不准,所以观望。西门不乱花钱,他告诉川妹子说他的钱每月都存到什么基金里面去了,还说他们两个人中间有一个人炒股就够了。 对于川妹子的炒股爱好,西门既不反对,也不鼓励,但是他总是喜欢和川妹子讨论为什么她要买这个股,为什么要卖那个股。当川妹子

    待学习
    开始阅读
  • 8

    第7章 飓风里行船只往后看

    未知 第7章 飓风里行船只往后看 川妹子发现了新大陆。 自从认识西门以后,她对任何量化的东西都很感兴趣。西门虽说是满腹经纶,但是从来不会给川妹子的热情泼冷水。不仅如此,他一般都是很鼓励川妹子的。 很多个傍晚,他们两个一起坐下来研究川妹子记录的各种数据,都是关于她见到的投资名人,西门趁机给她介绍很多统计的概念,更重要的是给她说统计数字后面所掩盖的问题。所以川妹

    待学习
    开始阅读
  • 9

    第8章 谁有下一个点石成金的手指

    未知 第8章 谁有下一个点石成金的手指 有一天西门和川妹子见面的时候好像心不在焉,川妹子知道他心里有事,就让他直接说出来,反正兵来将挡,水来土掩,没什么大不了的。西门锁着眉头说领导今天跟他谈话,准备让他去纽约工作,他们公司不久前在那边开了分支机构。 “那不是挺好吗?”川妹子兴冲冲地说,虽说她的心头也有一丝阴云。她接着问西门去了以后会不会提拔,会不会涨工资,西

    待学习
    开始阅读
  • 10

    尾声

    未知 尾声 川妹子怀孕了。 她和西门商量,孩子生出来,不管是男是女,都叫西门斯(一位朋友还建议如果是双胞胎的话,另外一个叫西门子。)。 2009年7月3日,纽约 美国联邦调查局指控一个叫阿累尼科夫的39岁俄裔男性,说他从他的前雇主高盛银行窃取电脑交易的机密,随后加入了另外一家由一个叫马里舍夫的俄裔人士开的对冲基金。马里舍夫2009年2月刚刚从对冲基金大本营集

    待学习
    开始阅读
  • 11

    致谢

    未知 致谢 作者感谢以下朋友和同行的支持与帮助:香港证监会阎宇红博士;北京控股陈洁小姐;香港《信报》姚志新先生;深圳吴严磊先生;大日精化公司李辉先生;中银国际黄晴宁小姐;法国巴黎银行陈湘毅先生、沙菲女士、高塞北先生(Sebastien Gaudre)、洪玉戈先生(Hugues Rondouin)、杨杰先生、黄雁小姐、林绮文女士、DarylEe先生;兰州酒钢忻

    待学习
    开始阅读
  • 12

    人物中英文对照表

    未知 人物中英文对照表 注:以翻译后的姓氏汉语拼音为序,前为名字,后为姓氏。 本书由“ePUBw.COM”整理,ePUBw.COM 提供最新最全的优质电子书下载!!!

    待学习
    开始阅读
  • 13

    参考文献

    未知 参考文献 [1]Really Big Bucks[J].Alpha.2006(7). [2]The Bucks Stop Here[J].Alpha.2004(7). [3]The Other Face of Jim Simons[J].Alpha.2004(6). [4]Tough Customers[J].Alpha.2004(5). [5]Ren

    待学习
    开始阅读

Local EPUB Text

第5章 趋势是你的朋友和敌人

未知

第5章 趋势是你的朋友和敌人

川妹子突然对一切量化的东西兴致盎然。当然,这一半是因为她本身是个聪明好学的姑娘,另一半是因为西门的影响,人家是个研究量化问题的专家,而且很愿意跟川妹子讲解各种问题,最后还有一半,不消说是我们这本书的需要——一本关于量化的书,什么事情都要量化起来才清楚嘛。

川妹子仍然持续着她的爱好,在上班的时间偷偷从书店瞄出去,看首都机场来来往往的旅客,有的行色匆匆,有的不紧不慢,她在寻找那些她能够认出的面孔。很多人都愿意寻找影星、歌星、笑星和体育明星,川妹子对这些人的兴趣不大。她常常见到这些人,其中的很多根本不用寻找,因为他们要么戴着很夸张的墨镜,要么戴着帽檐压得很低的棒球帽,或者夏天里戴着厚厚的毛线帽子。她见到这些人的时候一般会很失望,因为几乎没有例外,这些人都要比她记忆中的那些形象单薄、寻常、肤浅和缺乏善意。所以,川妹子觉得还是在电视上、电影里看到这些人更好一些。

川妹子的眼光还是集中在金融投资行业的名人身上。这些人一般都很低调,急急忙忙地走,似乎很有目的性。男的穿着西装革履,跟西门一样,女的通常也是深色的套装,川妹子觉得这些人反而都更有意思。不光是他们做的事情可能有意思,他们作为一个个大活人可能也很有意思呢。她也花一些时间上网看看这些人的介绍,特别是生活花絮之类的东西,一般都不多,但是这并没有减少她的好奇心。比如,那个常常被人家说成是中国最帅的投资银行家的人,他常常经过川妹子的门口,但是从来没有停留过,他业余时间喜欢做些什么呢?再比如,那个天天认为中国股市将走入下一场灾难,世界股市将要度过最冷的严冬,美元也将暴跌的评论家,个子不高,有时候会停下来翻翻书,他有没有在街上被人唾骂过呢?还有一个,人家都说他是中国投行业务里面翻云覆雨的太上皇,看上去有些痞气,他总是在讲电话,前后总有人点头哈腰,网上那些关于他的争议有多少是真的呢?对川妹子来说,这些都是秘密,这些都是故事。

川妹子把每天能看到的金融投资行业的名人都记录下来,并且进行归纳,慢慢发现了各种规律,比如一周里面的哪一天或者一个月里面的哪几天看到的名人最多,男女比例如何随着时间变化,人们的岁数、性别和早上或者晚上乘飞机的关系,等等。当她和西门约会的时候,谈论她所看到的人和讨论她所发现的规律已经成了他们聊天的固定话题之一。

有一天,川妹子告诉西门她的最新发现,关于每个月能看到的名人数量的起伏变化。川妹子说完,西门轻轻拍拍她后脑勺说:“你知道你发现了什么吗?我都不知道汉语应该怎么翻译,英语叫heteroskedasticity。”

川妹子看着他,说:“什么?黑的骡子开始踢四蹄?”

美联储和投机商

我在伦敦的交易大厅里面混了将近十年,主要的工作是担任量化金融工程师。我替银行的客户开发、设计、测试各种量化交易模型,这样可以讨好这些客户,希望他们多跟我们做生意。如果客户用了我们开发的量化交易模型,跟竞争对手比起来,我们银行就多了一个很大的优势,因为我们知道客户的交易模型,所以知道他们的交易方向,这样我们更加容易赚钱。我也替银行自营的投资基金开发过产品,不过在我曾经工作过的银行,这不是一个主要的业务方向。我没有给西蒙斯的基金设计过任何东西,我猜是因为人家的模型更好、技术力量更强吧!当年我们这个部门的交易额在全球常常能排到前三位,即便如此,我们这个部门也不过有十个博士,而西蒙斯有将近百个。

在重新开始窥视复兴技术公司之前,先讲一个我寻找模型失败的故事吧,算是个小小的前菜。当然我也有成功的例子,不过那要等到下一章。

从1997年起,我注意到了一位美国学者发表的一系列关于外汇量化交易的文章。他用的方法很特别,他的背景也很特别。他是美国中央银行美联储聘用的金融分析专家,不是一般的大学教授。他用的方法叫遗传编程。

遗传编程是一种量化方法,属于人工智能的范畴。人工智能有时候也叫机器学习,说白了就是让电脑来突破按照程序机械地完成指令的框架,能够像真人一样学习新的本事。用在金融的量化投资模型上,遗传编程的方法是想模仿生物进化过程中的变异、遗传和适者生存,使各种不同的投资模型进行交叉组合,然后把这些新的和旧的投资模型都放回现实生活(准确地说是“模拟现实生活”,因为用的是过去的交易数据。)中竞争,也就是说,让各种模型在真实的交易数据下过招,看看哪些赚钱多,哪些赔钱,赚钱的模型活下来,赔钱的丢弃。然后再重复前面的这一步,把活下来的投资模型当成是第二代,在它们之间进行随机交叉组合,然后再使它们互相竞争,得到第三代。这样重复下去,数代之后得到的投资模型可能会趋于稳定,不再变化,这就是竞争之后证明最适合生存的量化模型。再经过一系列的验证之后,这个模型就可以拿出去真刀真枪地上火线了。

从概念上讲,遗传编程是一个很简单、很直观的寻找模型的方法,和一般的量化模型的设计开发相比,这是草根式的,从下到上:给电脑一大堆简单的模型和规则,你们自己组合吧,生产出来的后代经过一代一代的择优筛劣,最后剩下的那一组或者那几组就是最适应环境的模型。不一定是最好的,但应该是最能生存的。与此相对,通常量化模型设计的方式是从上到下的,像上帝造人,之前已经有一个大模样,用泥巴或者肋骨条,按照心里的模样造出来,然后放到伊甸园里面试试车,也许做些小的修改。因为设计者事先已经考虑了各种问题,所以从他的角度来说,凿出来的模型就是最好的。但是遗传编程方法走的是不同的道路,应该说是集思广益的一种算法:每一代、每一种组合单独看上去不够系统、不够漂亮,但是经过多代演化之后的结果也许并不差。其实这种寻找最佳交易模型的出发点和市场交易的出发点类似:在市场交易中,每个人都想着自己的蝇头小利,但是最后组合起来却常常能找到效率很高的解决办法。

这位美联储的学者最开始用了一些大家都常常使用的简单规则,其中包括我们前面讲过的双移动平均线、通道突破系统,还有另外一些技术分析里面常用的规则,给它们不同的参数,这算是第一代,然后使这些规则自由随机组合、演变,“生”出很多第二代的规则,这些规则和第一代的规则一起接受历史数据的检验,看看哪些赚钱,哪些赔钱。赔钱的清除,赚钱的留下当成第三代的标本,进一步组合和演变。

我们举个简单的例子吧:假定第一代有两个规则,一个是前面说过的王老五的模型:今天的股价是否超过前面三天中两天的收盘股价,超过的话买入,收市前平仓;另一个是大奖章过去用过的规则,如果今天的开盘价远高于昨天的收盘价,比如高5%,抛出,为了简单起见,我们假定收市前平仓。

这两个规则可以产生突变:比如王老五的规则,变成今天看昨天的股价是否超过之前三天中两天的收盘股价,超过的话买入,收市前平仓,这叫王老五第二代;大奖章规则,变为如果今天的开盘价高于昨天早市的收盘价5%,抛出,这可以叫大奖章第二代。在遗传编程的计算中,上面的突变是由电脑随机产生的,一次有可能产生多个。

这两个规则也可以进行基因重组:比如一个新的规则可以是如果今天的开盘价高于前面三天中两天的收盘价5%,早市抛出,午市买入,这是王老五和大奖章的混合体,可以叫大王第二代。这种重组也是由电脑随机产生的,组合是无穷无尽的。

我们用历史交易数据来检验第一代和第二代的交易规则究竟表现如何,然后留下比较好的,淘汰比较差的,接着进行下一步的突变和重组。

这样重复下去,直到选出的投资模型基本上趋于稳定不再变化的时候,他就把这个模型当成是最适应生存的量化模型。这个模型里面也许有很多不同的子模型,因为模型和模型之间可以组合起来,这样做能够减少风险。同时,因为要筛选很多代,各种规则可能一个套一个,套很多层,新的规则变得十分复杂,人脑可能根本不能看穿究竟是什么样的逻辑关系。不过这没关系,电脑本来就是用来处理这些复杂规则的。

这位学者把这个新的模型用在金融行业里面交易量最大的外汇市场上,发现在所有试过的汇率上,这个新的量化模型都赚钱。学者终归是学者,他用数据分析的结果发表了数篇文章,最后的结论是外汇市场的有效性值得怀疑。这些文章加入了千千万万对有效市场假说提出质疑的洪流之中,也没有什么动静,因为我们说过了,有效市场假说的确有很多问题,问题随着数据的增多和研究方法的增多而增加,有些像英国的海岸线。

在我读到这几篇文章之前,类似遗传编程的人工智能模型在我们银行也被使用过。20世纪90年代人们用得比较多的人工智能方法之一叫神经网络方法,模拟人的神经系统对各种数据进行简单判断,各路的神经首先独自做出不同的简单判断,这些判断再由“大脑”进行汇总,得出最后的结论。现在,神经网络的分析方法在量化投资中用的并不是很多,因为这种模型一般需要的参数比较多,所以用历史数据做模拟交易的时候它们能赚很多钱,因为这些参数“记忆”了历史数据的沟沟回回。但是等到把这些模型用到实战中的时候,它们的生存能力一般都比较差,所以这类“传统”的人工智能模型在投资实战中不是很有用。

20世纪末21世纪初,电脑的计算能力节节攀升,新的人工智能算法慢慢被应用到越来越多的行业,遗传编程就是其中的一种算法。相对于神经网络,遗传编程对历史数据并不总是委曲求全,因为每一代计算的时候只是将已经有的相对简单的模型进行随机交叉和变异,并不是一味地增加参数。

我当时对这种算法的兴趣还源于另外一个考虑:那时候我接触到不少的量化投资基金,对它们内部的营运也慢慢有所了解,我觉得遗传编程所采取的计算方法其实和这些量化基金内部改进它们模型的过程是非常相似的。我们说过了,量化投资的模型一般会随着时间的推移而出现“疲劳”,所以任何量化基金都需要不停地改进自己的模型,这个过程通常是交叉和变异的过程:对已有模型的参数进行更改,在模型上加上其他一些条件,或者将两种模型套用,有时候也会加一些全新的模型,等等。新和旧的模型通常会在实际运作中混用一段,之后选出最适合的模型或者模型组合使用,而且这个过程是持续进行的,一拨完了接下来又是一拨。从某种意义上说,遗传编程的运算过程其实是把量化基金不断修改自己模型的实际运作过程放在电脑上进行模拟,所以我觉得这种算法挺有前途。当然要说一句,这种比较复杂的算法通常都存在过分依附历史数据的毛病,所以并不是越高级、名头越怪的算法就越好,更不能说越高级的算法越能赚钱。通常来说,高级的算法都只是对历史数据的描述更好而已,这个问题我们在后面说到数据挖掘时要仔细来看,现在先按下不表。在使用遗传编程算法来选择模型的时候也要格外注意这个问题,好在美联储的学者在这方面考虑得比较周到。

我跟作者取得了联系,他澄清了我的几个疑问,这更使我觉得这个模型能够挣钱。我想复制他的研究结果,但是当时我们银行正在经历一场惊天动地的合并(前面说过了,由长期资本管理的倒闭引起的),所以人心惶惶,我找不到合适的技术支援来完成编程和运算,我自知自己的编程能力实在是不能向这样的任务挑战的,所以我跟作者建议说能不能向我们公开他的源代码。给美联储的学者付钱自然是连想都不用想的事情,我提出的交换条件是我们可以向他提供一些我们银行独有的数据。数据对研究人员来说就像璞玉对于一个玉石匠人,尤其是我们银行是很大的做市商,所以有很多质量很高的价格和交易量数据,外界没有。他一听就动心了,立即同意。我通过银行的法律部门草拟了一份保密协定,发给了他,大意是说双方都没有触犯知识产权法律等,所做的交换天知地知。可是他突然间没有了音讯,过了一段时间我才联系到他。原来他拿着我们的保密协定给美联储的律师看的时候人家提出了意见:“美联储研究人员的研究成果被市场上的投机商拿去投机,这是不是有一些道德上的问题呢?”人家律师连着用了两次“投机”这个词,态度是很明确的。这位学者和我只能笑笑,最后作罢。虽说到了后来我还是没有忘记这个模型,但是我的工作性质发生了变化,不再跟模型打交道,所以也没有把过去这个断了的线索捡起来过。再后来我见到一些资料,遗传编程这种方法的确在那个时间前后被几个比较大规模的量化基金所使用。

千奇百怪的量化方法

通过这个作为前菜的小故事我想要说的是:量化投资的模型和研究手段太多了,涉及很多貌似不相干的领域。可以毫不夸张地说,基本上所有理工科能用到的工具都已经在投资模型上试过了。除了高等统计学里面所罗列的研究方法之外,在量化投资中扎下根的还包括许多常常被人提到的其他研究工具和方法,比如:模糊逻辑、神经网络、基因编程、隐含马尔可夫模型、小波变换、贝叶斯网络、分型几何、聚类分析,等等。既然这是一本讲量化技术的书,我们不妨在这里简单介绍一下,没有兴趣的读者尽可放心跳过这一节。

·模糊逻辑——一种进行逻辑判断和运算的方法,假定各种概念不能完全用“是”或者“否”来代表,而可以是70%的“是”,30%的“否”,亦即我们通常说的似是而非;做逻辑判断的时候也不能简单地说如果“是”的情况下则如何如何,要么如果“否”的情况下则如何如何,因为“是”或者“否”本来都不是完全确定的。在模糊逻辑中,判断都是要通过一些特定的模糊运算来完成。可以看到,模糊逻辑的运算方法是针对现实生活中许多不能用泾渭分明的逻辑关系来表达的情况设计的,在量化投资分析中常常无法准确判断,所以存在同样的情况,使用模糊逻辑可能比较合适。

·神经网络——前面提过,将很多小的模型组合起来,模拟人脑判断方式的运算方法,每一个小的模型都相当于一个神经元,可以单独简单思考,然后由一个“大脑”做出总判断。比如一个小模型只用双移动平均线法判断短期趋势,另外一个判断长期趋势,还有一个使用通道突破法,等等。每种模型分别判断,然后神经网络会把它们综合起来。这种方法也可以和模糊逻辑联合使用。

·遗传编程——前面也提过。模仿生物进化中基因突变和重组的过程,让很多模型自由突变、组合,通过现实数据来寻找最能适应环境的模型组合。

·隐含马尔可夫模型——马尔可夫模型指某种价格或者系统从上一个状态跳到下一状态的随机过程,下一步和上一步之间没有什么直接的关系,也就是说,这个系统没有记忆。隐含的马尔可夫模型是指有些变量无法直接观测的情况,这个模型是在复兴技术创业时代参与过的里昂纳多·鲍姆首先提出来的,现在在很多领域都有应用。在金融中它可以被用来推测目前的市场状态究竟是趋势呢还是在区间徘徊,究竟是高波动性的状态还是低波动性的状态,等等。1993年加盟复兴技术的剑桥大学数学博士尼克·帕特森就是全球这项分析技术公认的专家。2000年他离开复兴技术,将这种分析技术用到人类基因的破译工作上。复兴技术使用这种模型的可能性非常大。

·子波变换——信号处理的一种技术。通俗地说,就是制造出一些特定的波动,叫小波,然后让这些小波跟所要研究的对象互动,等到再把小波分离出来的时候,小波里面就有关于研究对象的一些信息了。制造不同的小波,就能探听出不同的信息,这种方法在很多行业都有应用。在处理金融数据的时候,用波的方法来分析应当算是一个比较独特的角度,因为波的长度、频率之类的概念是我们平常研究金融数据的时候不十分关注的东西。举个例子,小波可以是一笔小的交易,通过市场价格对此的响应,你可以推断出是不是有什么大的交易潜伏在什么价位。

·贝叶斯网络——贝叶斯计算方法归功于18世纪的英国数学家贝叶斯神父,主要的意思是说各种概率只是目前的一个不完全的信念,而不是上帝安排好的一成不变的东西(这当然不是贝叶斯神父的原话),人们应该按照最新出现的信息来更新各种概率。贝叶斯网络就是按照这个思路建立起来的一个网络,描述一系列不确定的数据和过程之间的可能存在的因果关系,并不断更新。

·分型几何——前面提过了。分数维数的空间和混沌系统,蝴蝶扑闪出来的龙卷风。

·聚类分析——一种统计工具,按照数据和一些事先制定的标准将各种不同的对象分成不同的组群,其实也就是我们通常说的个子大的人站后边,个子小的往前站的复杂版本。当然,用机器来完成的聚类分析不仅仅能在很短的时间内将大量的数据分门别类,而且能找到我们并不知道的类别。

这些分析方法也许听上去都很复杂,其实我们日常生活中接触到的许多东西都使用过这些方法:比如互联网的搜索、电网上电量的调整、天气预报、疾病的诊断、基因的筛选、药物的设计和测试、电子信号的压缩和传输、手机上的手写体输入和语音拨号,等等,所以它们被用在金融投资上面并不是那样奇怪。当然,我们猜这本书的读者更关心的是点钱点到手发软的西蒙斯所使用的量化模型,那么我们就接着说回西蒙斯吧。

有关他的交易模型的消息自然不可能在学术杂志上找到,但我们也不是一无所知。

你是否在撒谎

还记得1990年从埃克斯手中买走埃克斯有限公司股份的加州大学教授伯乐坎普吗?他当年成为埃克斯有限公司总裁,1年以后他以6倍的价钱把股份出售给了西蒙斯。他应该是给西蒙斯的交易模型打下最早的基础的人,但是他觉得跟搞金融的人打交道很闷,所以选择留在校园里面。

伯乐坎普在自己的简历上说:大奖章的交易模型所使用的分析数据的方法基本上都是源于他的统计信息理论。

统计信息理论应该说是一种从大量的噪音中寻找信号,最后做出结论的方法,跟我们前面提过的最大熵理论和隐含马尔可夫过程都有关系。理论的本身非常学术化,三言两语也说不清楚,但是伯乐坎普的研究是从一个大家熟悉的游戏开始的。我们平常所玩的“猜人名”的游戏是这样的:两个人,一个提问,一个回答是否。回答问题的人随便想一个古今中外的人名,提问的人来问问题,而回答人只说“是”或者“否”,看看在多少个问题之后提问的人能猜出回答人想好的那个名字。虽说大千世界的人物那么多,但是通常问问题的人都可以用十几个问题确定回答人想的是谁。伯乐坎普关注的问题要比我们这个游戏复杂一些,回答的人可能在回答问题的时候撒谎数次,所以猜的难度一下子增加了,因为你不知道回答的人说“是”的时候是在说真话还是在说谎。伯乐坎普的统计信息理论研究的是关于三个变量对提问的人能否猜出正确答案的影响。这三个变量是:第一,想名字的范围有多大,1万人?10万人?范围越大,越难猜;第二,问问题的人可以问几个问题,问题越多,越容易找到结果;第三,提问的人能撒几次谎,次数越多,越难猜。伯乐坎普的理论给出了这三个变量之间的关系。

我们不知道这个理论究竟是如何被伯乐坎普和西蒙斯用在价格规律的发现过程中的。一种可能性是研究过去一段时间(比如说1万天,相当于上面说的范围变量)的价格变化,每一次变化只有两种可能,上或者下,相当于“是”和“否”;我们可以把每天价格变化之前的各种价格走势当成是各种问题:比方有一天价格上涨了5%,之前价格连续三天上升,另有一天价格下跌了3%,当前这个月份第一个周四的上午价格先涨了2%之后又回落了1%,等等。我们把这些观察到的东西当成是各种不同的问题,而把随后那一天的价格变化当成是答案。前面的价格现象可以转化为这样的问答:

问:“如果前三天的价格连续上升,今天的价格会涨5%吗?”

答:“是。”

问:“如果本月第一个周四上午价格先涨了2%之后又回落1%,今天的价格会跌3%吗?”

答:“是。”

上面的两组问答可能是市场上存在的规律,也可能是巧合,问和答之间毫无关系;换句话说,答案可能是假的。我们不知道究竟有多少答案是真的,有多少是假的,所以我们无法从大把大把的巧合和偶然中找到真正的规律。使用伯乐坎普的统计信息理论可以去掉很多噪声,有效寻找到真正引起价格变化的那些条件。

语音识别也是同样的道理:需要从人们所发出的各种因人而异、似是而非的声音里面寻找信号,过滤掉各种噪声。复兴技术雇用了很多这方面的专家,这使我们推测,它的主要分析方法是跟统计信息论、隐含马尔可夫模型和最大熵相关的信息处理技术。这种技术的使用使复兴技术能够更有效地从过去的价格中去除大量噪声,发现规律。西蒙斯在复兴技术的左膀右臂布朗和默瑟都是这方面的专家。

重新审视西蒙斯的量化模型

接下来,我们来重温一下我们已经知道的关于西蒙斯的量化模型的信息,包括他已经不再使用的量化模型:

1.市场过激反应

如果某个期货的价格在开盘的时候远远高于前一天的收盘价,大奖章会沽空这个期货;如果开盘价远低于上一天的收盘价,那么大奖章就会买入。

这个模型是复兴技术的创始人之一施特劳斯在2007年接受采访时说的,而且他说过去大奖章靠这个模型赚了很多钱。言下之意,这个模型现在已经不赚钱了,所以才说给公众听。

这个模型针对的正是市场对于新的消息常常反应过激的现象。高开或者低开,那么返回原地的可能性要大于扔硬币出现正面的概率,所以大奖章高开之后抛出,低开之后买入。这个模型在很多的投资书上也有提过,肯定有很多人专门做这样的交易,所以现在用这个简单的形式赚钱的可能性已经不太大了,因为在同一个地点采同一种蘑菇的人太多。但是,投资者对消息反应过激的偏差并没有消除,所以类似的情况肯定会在其他许多地方出现,或者以其他形式出现。

比如说,在整个一天的交易过程中(而不是仅仅看开盘价和收盘价),有可能某个汇率的价格突然大跌或者大涨,或者某个股票的价格在公司有新消息公布之后突然大幅波动,这时候它们返回原地的机会就比较高。我们可以想象,使用一些量化模型对这类变动进行分析,将那些返回原地的情形和没有返回原地的情形分类,寻找一些能够区别两类情形的条件,然后再使用这些条件进行交易。条件是什么意思呢?我们举个具体的例子:是不是某种汇率在1分钟之内价格变化超过2%以上回归的可能性大一些,但是如果变化只是15%就不一定?另一个例子:是不是同时有多只股票的价格(标准普尔500指数里面的250只股票)移动超过1%的时候回归的可能性大一些?又一个例子:在过去30天中已经出现过一次或者两次以上价格波动之后又回落的商品期货,如果再次出现价格波动的时候,回落的可能性是不是会大一些?这类各种各样的“如果……那么……”都可以算是一个个量化投资模型,它们的变化是无穷无尽的,有的可能有一定的道理,有的则很难解释。

市场过激反应

投资人常常采取和其他投资人相似的策略,也就是“扎堆儿”,这样金融价格的变化常常是“矫枉过正”。

量化研究可以对这些林林总总的模型进行分析、归纳,依照历史数据进行模拟,可以给出各种模型的历史回报和风险。但是,数据研究到了一定的程度,最后还是要西蒙斯这样的人来判断:通过量化研究找到的那些过去表现很好的模型只是数字上的巧合呢还是有一定的道理?它们未来重复出现的可能性有多大?如果西蒙斯认为它将来再次出现的可能性要比随机出现的大,那么他就有可能将这个条件编成程序,放到计算机里面去。如果未来这个条件再次满足的话,计算机就可以自动进行交易。

寻找这类机会,计算是否满足各类条件需要很强的计算能力,因为你可能需要对市场上的各种交易进行连续监控,获取各类数据,并且在最短的时间要做出响应。我们根据已有的资料分析,这类模型仍然是大奖章使用最多的一类模型:追踪很短线的市场过激反应,采取相应的买卖手段,等待市场的回归。西蒙斯自己也说过:当市场波动性比较高时,大奖章的模型一般表现较好。大奖章使用的这类短线过激反应的模型正适合于市场上下起伏状况:大家都摸不着北,一会儿要买,一会儿要卖,西蒙斯的电脑模型正好在浑水里面摸鱼。

2.套利交易

如果美国政府债券长期债券的折价远远高于短期债券的折价,那么购入长期债券,抛出短期债券。

这类模型是西蒙斯自己于2000年11月接受采访时透露过的。他当时也承认,像这样的机会现在已经不存在了,因为有很多像长期资本管理这样的公司专门做这样的生意。美国政府债券交易市场是交易量非常大、信息流动很迅速的市场,这样的套利机会的确寥寥无几,其他西方发达市场的政府债券也情况类似。所以基本上可以肯定,大奖章现在不做这类交易了。

但是在一些新兴市场的国家债券市场上,这样的机会仍然可能存在,大奖章有没有在那些市场上交易呢?西蒙斯说过,大奖章只投资流动性比较好的产品,所以我们推测它投资新兴市场债券的可能性也比较低。

我们的估计是,大奖章的债券和利率方面的投资方向可能主要是两块:一块是交易很频繁的债券期货、利率期货,这类交易属于上面提过的短期过激反应模型的交易范围;另一块是流动性比较好,但是在柜面交易的利率掉期合同,这个我们下面单独说。

3.趋势和联动性

追踪商品市场的中、长期趋势。

这个模型也是西蒙斯自己于2000年提过的。但是他也说了这类中长期的趋势现在已基本上不存在了,即便存在的话能赚到钱的机会也不大,原因也是很多人都在做这类套利,所以机会就没有了。我们推测,大奖章已经不使用这类比较长线的趋势模型了,虽说它过去很可能使用过这类模型。

商品期货的交易现在流动性越来越大,参与者越来越多,其中包括不少所谓的长线投资者,所以在这个市场进行短线交易的机会应该越来越多,主要是前面所说的过激反应的一类,也包括我们后面要提到的市场微观结构的一类,大奖章的这两种模型都应该用在商品期货市场上。

我们认为西蒙斯的交易模型里面还有可能包括商品期货价格和相关股票、汇率价格联动的交易模型。比如,原油期货的价格和中石油的股票价格应该有一定的关系,但是原油期货的价格变化可能更快一些,中石油的股票价格可能需要几秒,或者几毫秒的时间来反应,如果模型的反应足够快、交易速度足够快的话,这也是一类短线套利模型。这种联动的关系在各类金融市场里面有很多:商品价格和股票价格、商品价格和商品出口或者进口国的外汇汇率、外汇汇率和贵重金属价格、利率和金融类股票的价格、利率和外汇汇率,等等,虽说我们没有确凿的证据证明大奖章的确在从事这类利用相关性的套利操作,但是我们认为这类交易符合它传统的捕捉过激反应的模式,而且它能够快速处理大量数据的优势也可以在这方面用上,所以它从事这类交易的可能性是比较高的。

4.偏门信息源

使用交易量信息和其他不太常用的信息源。

这是在2004~2007年间复兴技术诉讼千禧公司以及两名前雇员白罗波尔斯基和沃尔夫冰的案件之中透露出来的。使用交易量数据来辅佐预测未来的价格变化并不稀罕,很多投资人都会参考过去一段时间某只股票或者期货的交易量来进行交易决策。但是这个方法在一些柜面市场交易的产品上可能做不到,因为没有公开的交易量数据。另外,交易量数据反映的只是已经成交的交易量,但是从某种角度来讲,那些可能成交但是还没有成交的交易包含更为重要的信息,因为它们还没有做成,将来做成的可能性仍然存在,做成的话会影响股价未来的走势。

很少有人会去关心没有做成的交易。

我们已经知道这个套路了:西蒙斯会。

在沃尔夫冰反诉讼复兴技术的文件中,沃尔夫冰声称复兴技术公司要求他开发一套交易程序,这个程序能够通过分析“限价买卖指令表数据”而对下一步价格变化进行预测。限价买卖指令是一类比较常用的交易指令,投资人限定在某个价位买入或者沽出一定数量的股票或者其他工具。股票交易所会及时公布这类数据,交易人在下单的时候能够看到在当前买入卖出价的上下方都有多少买入、卖出的限价指令,这样他也能够对价格的下一步变化做出一些判断。但是对一些交易量很大的股票或者其他工具来说,限价买卖指令表是一个非常庞大的数据库,而且投资人在不断增删或者调整买卖指令,所以指令表还在不停变化,一般的投资人看到的只是这个表格很小的一部分。要想从这个庞大而且是不停变化的“列车时刻表”上看出风景,同时在最短的时间内发出生杀指令,这不是人脑能够完成的,也不是一般的量化模型和电脑系统所能够做到的,而复兴技术公司无论在量化模型还是在电脑系统这两个方面都远远领先同行:它所招募的许多专家正是大规模信息处理的行家,它的电脑系统要比一般大学的电脑系统功能强大许多,所以它去看风景有着得天独厚的优势。

通常各个交易所都会公布限价买卖指令表,但是能够真正在实际操作中使用这些数据的投资手段还不多。我们前面提过的麻省理工学院的量化专家罗闻全教授推测说:假定某只股票的交易价格是15.05美元,如果某人通过细筛限价买卖指令表的数据发现在15美元有一个数额很大的沽空限价买卖指令,他就可以在15.01美元开始沽空这个股票,如果15美元的沽空指令被执行的话,股价肯定会受到打压而大幅下降,这时候他再将沽空的股票买回来,从而获利。罗闻全说:“如果有很大的沽空指令等在股价下方的时候,股价肯定会受到很大的向下压力。”但是也有人不同意罗教授的解释:股票最后的交易价格是15.05美元,如果这时候有一个卖出指令是15美元,那么这个在市场价格之下的卖出指令会立即被执行,不可能给谁在15.01美元沽空的机会,所以那个例子是不合适的。

但是这种在交易价格之下沽空或者在交易价格之上买入的限价买卖指令在柜面市场是很常见的,它们常常被投资者用来作为止损的手段。所以在柜面市场上,做市商或者其他人如果能看到投资人的这类限价指令的话就有可能进行“超前交易”,搭顺风车。这种做法虽说违反监管规定,但是在做市商的交易部门是非常常见的,也是做市商利润的一个重要来源。可是,复兴技术公司不是做市商,所以不能直接从这个方向获利。

我们的推测是:复兴技术通过某种统计算法来快速综合限价买卖指令表里的各种信息,能够很快判断出在不同价位不同数量的限价买卖指令对目前的股价究竟是推还是拉,还能够判断出如果股价真是达到了某个或者多个限价买卖指令,这些交易被执行之后,股价又可能会有什么样的连锁反应。

我们可以拿一个斯诺克台球桌来比喻:白色球是目前的股票价格,它停在球桌的正中央;许许多多的限价指令像桌上的其他球,数量很多,每个球都有不同的分量,而且都在移动,跟白色球的距离也不同。这些球都对白球有吸引力或者排斥力,所以你可以估算出来如果在没有桌面阻力的情况下白球会向哪个方向滚动,你还可以进一步计算白球在滚动的过程中会碰到哪些球,反弹之后的方向和速度会如何,等等。有了这个判断之后,你就可以采取相应的交易策略,如果你的判断正确,你就可以赚钱。

从纯粹物理学的角度来判断,你可以将白球的轨迹很准确地进行预测,但是我们知道在金融市场上,不断会有新的消息到来,要么直接改变白球的轨迹,要么通过改变其他球的大小、位置、速度和方向来间接改变白球的轨迹,所以你不可能准确预测。但是,如果这些新的信息的到来完全是随机的,那么你把这个实验重复千万次的话,那些随机的效果会相互抵消,剩下的就是准确性相当高的预测了。准确性相当高的预测用另外的话说就是旱涝保收的投资回报。

市场微观结构

在目前市场交易价格的上下方都有很多买盘和卖盘,它们将决定在很短期的将来市场价格是如何变化的。

资料来源:斯诺克照片来自维基媒体。

沃尔夫冰在他的反诉讼中指称,他认为复兴技术的限价指令表模型会触犯到证券交易法的有关限制条例,所以他拒绝开发这个交易程序。他说在他2003年离开复兴技术公司的时候该公司还没有使用这个程序。究竟这种算法有没有触犯美国法规我们无从判断,但是如果用的是公开渠道可以获得的信息,进行一些运算而获得的新的信息,这应该是合法的。复兴技术后来有没有用这个模型我们也不知道,但是可以肯定的一点是,使用别人很少使用的信息来进行分析、判断和交易的做法肯定也是复兴技术长盛不衰的一个重要方面。这类使用限价买卖指令数据来判断价格走势的基金现在已经有几家,一般都不大,像复兴技术这样技术力量雄厚、能够在全球多个市场同时操作的公司还比较少。

复兴技术使用其他信息源的另外证据也是来自沃尔夫冰的反诉讼文件。他指称他在复兴技术公司的上司让他开发一个模型,从一个交易系统的公开数据中推测出交易系统本来要保密的信息,从而获利。他说的交易系统叫“机构投资组合交易匹配系统”,是美国一家叫投资技术集团的公司提供的,供机构投资人交易的电子平台。这个平台其实跟普通的股票交易所有些类似,但是所有的参与者都是大的基金,没有通过券商交易的散户,也没有虎视眈眈的做市商。这种绕过大家熟知的交易所进行交易的平台叫“暗池”,在过去10年的发展非常迅速。一方面是因为电子交易技术的发展和普及,另一方面是许多机构投资人对交易所垄断地位的不满,许多国家也都慢慢放开了交易所之间的竞争,允许新的平台提供跟交易所类似的服务。这些平台的交易成本一般比较低,而且保密性可能要比交易所高,因为在这些平台上,限价指令通常是不公开的。在沃尔夫冰的诉状中他没有谈及究竟复兴技术想要窥视何种投资技术集团不愿意透露的信息,但是我们估计很可能也是跟限价买卖指令相关的数据。

沃尔夫冰在诉状中说,他当时就告诉了复兴技术的老板这种做法是违反证券交易法规的,所以他拒绝参与这个项目。当然,这是诉状里面的一方之词,当时的情况究竟如何,复兴技术拒绝评论。沃尔夫冰说后来投资技术集团采取了相关的措施,堵住了这个有可能被外界窥视的漏洞,所以复兴技术最终没有采用这个模型。

这两个指称都说明复兴技术的一些交易策略着重分析那些较少为人所关注的数据来源。这些数据来源较少被人所关注一般是有原因的,常常是所需要的技术的复杂程度很高。

5.买卖掉期合同

这也是在2004~2007年的诉讼案件中透露出来的。沃尔夫冰指称复兴技术使用掉期合同的交易方法是一个“大骗局”,但是他没有具体透露是哪一种掉期合同,为什么是大骗局。他在反诉状里面说复兴技术的做法违反了美国证交会和全美证券交易商协会有关证券沽空的法规。

在交易工具的选择上,复兴技术一般走的是标准化的道路,选择买卖流动性高、历史数据比较齐全、交易成本比较低的各种工具:外汇、商品期货、利率和债券期货、蓝筹股票都符合这些条件。很多比较复杂的期权因为都是柜面交易,而且买入卖出价差比较大,所以不太适合大奖章基金快速买入卖出的交易方式。西蒙斯1998年才邀请罗闻全到复兴技术公司去讲授关于布莱克-舒尔斯-默顿的期权复制和标价的理论,但是那时候期权的交易已经非常普遍,我们提过的芝加哥奥康纳兄弟早就通过交易期权而盆钵满盈,由此我们可以推断复兴技术很少使用期权或者其他复杂的产品。事实上,这样一个非常成功的投资基金很少使用非常复杂的产品,对普通投资人来说,这也许是个值得思考的问题。

掉期合同在外汇、债券、股票领域都存在,指合同的双方同意在将来特定的时间按照事先商定的办法交换一系列现金流。比如外汇掉期,一般有两个日子,在比较近的那个日子,甲乙双方交换一笔外汇;到了较远的那个日子,双方再换回来,两次交换的数目稍有不同,以反映两种外汇之间利率的不同。按照每日交易量来说,外汇掉期是外汇市场交易量最大的一种合同,而外汇市场又是全球交易量最大的一个市场。利率掉期我们在讲长期资本管理的时候提起过,这类合同一般期限比较长,从数年到三四十年不等,双方在固定的日子里交换现金流,通常是一方支付固定利率,一方支付浮动利率。按照总存量来说,利率掉期是金融行业存量最多的工具,因为一笔合同的期限通常很长,所以总存量很大。外汇或者利率合同都是流动性非常高的工具,所以复兴技术把它的短期交易模型用在这两种工具上不足为奇。另外,这两种工具其实都是其他一些交易量同样很大的简单工具组合起来而成的,复兴技术也有可能通过监控整体和零件之间的价格差别而寻找套利机会。不过这种套利操作是很常规的,所以机会也许是凤毛麟角。但是利率掉期和外汇掉期怎么会触犯证券沽空的条例呢?一个可能性是组装利率掉期的零件之一——政府债券期货合同——的交易要受到一定的限制,美国证交会和全美证券交易商协会有关证券沽空的限制条款包括防止操纵市场的内容,通过交易利率掉期合同,复兴技术可以间接沽空相关的美国政府债券期货。

另外一种可能性是复兴技术交易股票掉期。这类合同的甲方乙方在未来固定的时期交换现金流,一方按照某种利率,另一方则按照某种股票或者股票指数的表现。这种产品的交易量不大,都要通过投资银行量体裁衣而完成,所以流动性并不高。但是这种产品的基础——利率的变动和股票价格、股票指数的变动——都是有很多数据可以用来做量化分析的,所以,复兴技术通过这种产品来沽空某种直接沽空可能受到限制的股票或者股票指数的可能性也是存在的。但是我们觉得这种可能性比较小,首先,这不太符合复兴技术一贯的交易原则;其次,如果复兴技术长年累月买卖这种交易量不太大的工具,那么复兴技术使用股票掉期合同的消息应该早就传到市场上了。我们目前没有看到任何关于该公司交易这类产品的报道。

综合起来看,复兴技术通过交易利率掉期而间接影响政府债券期货的可能性比较大。

另外,从已经掌握的资料来看,复兴技术公司交易范围的扩大通常不是通过使用比较复杂,或者最时髦的产品来达到的,它最可能采取的多元化策略是将成熟市场已经用过的那些交易方法用到其他比较新的市场中去。它申请印度股市的交易牌照就是一个例子,它在中国股市上进行交易的那一天我想也不会太远。

模型的新陈代谢

除了上面所说的这五点之外,西蒙斯接受采访时的另外一席话也是值得思考的。他说:“我们起初建立大奖章基金的时候试图捕捉的那些市场异常到目前仍然存在,不过它们都有些弱化。在这种情况下,你必须加大交易的幅度。你的交易系统必须是一层上面又有一层。每个新的交易策略被提出来之后,我们就在内部讨论,这究竟是一个全新的交易策略呢,还是包括在我们已经有的模型里面了?这时候我们就需要使用统计测试的方法来判断这个所谓新的交易策略究竟是不是新的。如果真是新的,我们下一步的工作就是确定给这个新的交易策略多少权重。这就又给我们的模型体系新加了一层。我们会不断给我们的模型添加新的内容的。”

这段话值得细究。第一,它多少证实了我们上面的第一个猜测,那就是复兴技术最主要的策略是利用市场过激反应这个现象,捕捉价格跳动之后回归的那些机会。第二,复兴技术所使用的杠杆可能有所升高,因为市场信号在弱化。当然复兴技术的杠杆不可能达到长期资本管理的水平,从我们已知的信息来看,这家公司所使用的杠杆水平相对其他对冲基金是比较低的。第三,复兴技术在最近十几年中的交易速度越提越快,这也很可能是西蒙斯说的“加大交易幅度”的一部分。第四,复兴技术不断引进新的模型,将新的模型和老的模型并行使用。

复制复兴技术

这些基本上就是我们已经了解到的关于复兴技术公司交易模型的信息了。还有另外一条,就是前面西蒙斯在给投资者的信中提过的“基本系统”,我们留到本章稍后再交代。当然,如果你想凭着上面说的一些东西来“复制”复兴技术的模型,光靠这些还差很远。很多银行和复兴技术的竞争对手都想复制它的天书秘籍,复兴基金不惜去打官司来捍卫自己的秘密。

我们随后还将看到,复兴技术公司成功的秘密不在一个公式上:它有很多不同的公式,适用于不同的工具和不同的市场条件;它另外还有很多公式,帮助它进行风险管理(何时入市、何时止损、何时止盈、每种交易公式之间的分配、杠杆的配置等);它还有很多公式控制公司的交易成本。

退一万步,如果西蒙斯把所有的公式都交出来,能把这些公式变成钱的公司和个人在全球仍然是屈指可数。为什么?答案在公司的名字里面:一家投资公司,却叫复兴技术。很多人都认为,大奖章赚钱最大的秘密就在它的技术上。这里的技术指的是电脑技术、通信技术,这正是我们下一章的话题。

关于复兴技术交易模型的探秘之旅我们还没有走完,不过我们要先开个小差,说说其他的量化基金。

量化基金当然并不只是复兴技术公司的专利,非常成功的量化基金也不只有复兴技术公司一家。常常有人会把西蒙斯的复兴技术公司和另外两三家公司相提并论,称他们是“超量化基金”,借用宋丹丹的话说,那就是量化基金里面的战斗“基”。这三家分别为电脑博士大卫·肖尔的DE肖尔基金、最年轻的对冲基金亿万富翁肯·格里芬的大本营投资集团(这家公司的英文名字叫Citadel Investment Group,国内有译作城堡投资集团或者城堡集团的。另外一家美国的另类资产管理公司的英文名字叫Fortress Investment Group,也有很多人将其译作城堡管理集团或者堡垒集团,后者是在纽约股市上市的公司。这两家公司都在中国有投资,可惜我们没有找到公司自己确定的译名。在本书中,为了统一起见,我们将前者译为大本营,后者译为城堡。)和斯蒂文·科恩的SAC资本公司,三家基金的创始人都是年度《财富》杂志全球亿万富翁排行榜上有名有姓的人物,我们分别简短说说。

计算机博士肖尔

肖尔生于1951年,是加州大学圣地亚哥分校的学士,1980年获斯坦福大学的计算机博士,毕业后他曾在哥伦比亚大学的计算机科学系任教一段时间,研究的方向是并行计算,用外行的话说就是很多计算机通过分配工作,将一个复杂的问题分成很多小块来分头完成计算的方法。1986年他加入了摩根士丹利,负责自动分析交易。两年后,他独立门户,成立了DE肖尔公司,专门从事量化投资、交易。

他曾经说过:“金融投资是最完全的信息处理工作”。这跟我们把复兴技术公司和谷歌公司相提并论的说法一致。《财富》杂志曾经把DE肖尔公司描述成“华尔街最神秘的和最令人好奇的一个公司”。公司雇员超过1500名,一半是电脑技术专家,其中包括300多名在印度的软件专家。

跟西蒙斯一样,肖尔也常常是从学院雇用科研人员来成为他的量化研究专家,但是肖尔没有像西蒙斯那样盘踞在象牙塔的最尖顶,只找科学家。按照该公司网站上的说法,DE肖尔公司的雇员里面包括2003年美国女子象棋比赛的冠军、桥牌大师、作家、运动员、音乐家和大学教授,超过100名员工有博士学位。值得一提的是DE肖尔公司的网站上还专门提到公司的许多员工过去都创过业,曾经有过自己的公司,可见该公司比较鼓励员工想入非非。当然DE肖尔有着一个耀眼的前员工,这就是全球最大的网上书店曾经收购了中国卓越网的美国亚马逊公司的创始人杰夫·贝佐斯。

从2001年起,肖尔把更多的时间花在科学研究上面,而DE肖尔公司的日常运营则交给了6名董事总经理来管理,肖尔仍然持有公司半数以上的股权。肖尔的精力花在量化生物化学的研究上,主要是应用量化技术,寻找癌症的解药。

跟西蒙斯一样,DE肖尔的主要交易方式也是短线操作,尤其是使用统计套利的方法进行股票多空交易策略:同时购入和沽空相似数量的相关股票,通过它们之间差价的变化来盈利。它常常高速买卖大量的股票,它的交易量有时候占到美国纽约股市的5%以上。但是从2003年开始,该公司也开始介入私募基金的投资,并且参与购买不良债券的业务,这也是公司将收入来源多元化的步骤之一。另外,DE肖尔集团还为其他金融机构提供电子技术的服务,这也是发挥公司的相对优势吧,这项业务是通过它在印度的子公司来完成的。

克林顿总统时代的美国财务部长劳伦斯·萨莫斯在2006年辞去哈佛大学校长的职务(萨莫斯2005年说女性在高等学府教研人员中的比例较低的原因是因为她们“在高端的能力上有限”,这引起了广泛的争议和反对,也是他后来辞职的原因之一。)以后加入了DE肖尔,任董事总经理。2008年他接受奥巴马的邀请再次加入政府而离开了DE肖尔。在DE肖尔任职期间他的收入超过500万美元,有人计算,他在该公司总共的工作日不过是100天左右,每小时工资折合超过4000美元,这在华盛顿国会山引起了不少非议。

2007年,肖尔向雷曼银行出售了DE肖尔20%的股权,价格没有透露,但是当时诸多银行纷纷购买对冲基金的股权,身价肯定不菲。那时候有报道说这是肖尔的二次婚姻,希望双方好运。1997年,肖尔和美国银行签订协议,美国银行给他借款14亿美元供他投资。随后不久,俄罗斯政府违约,亚洲金融危机开始,长期资本管理倒闭,DE肖尔虽说没有被击垮,但也只是侥幸逃命。美国银行赔了3.7亿美元,总裁引咎辞职,那是肖尔的第一次婚姻。肖尔第二次婚姻的对象雷曼银行的下场如何我们已经知道了。

目前DE肖尔的主要策略仍然是量化的统计套利。

最年轻的亿万富翁格里芬

这本书里面提到的很多人都是亿万富翁,其中最年轻的应该是大本营投资集团的肯·格里芬,他生于1968年,是哈佛大学的经济学学士。在学校读书的时候他就开始买卖股票,因为他那时候买不起能够看价格的终端机,所以常常在课间休息的时候跑去券商的营业部看最新的价格。他22岁不到就开创了大本营集团,最开始的时候专门从事可转换债券套利的策略。现在该集团管理的资金额大约为130亿美元,比两年前的最高点200亿美元缩水不少,但是仍然是全球最大的对冲基金之一。他的基金同样交易频繁,通常要占美国、伦敦、中国香港和东京股市的交易额的3%左右。该集团大量采取量化投资策略,尤其是可转债套利策略和统计套利策略。可转债是将来可以转为股票的一种债券,它可以用布莱克-舒尔斯-默顿的方法分解成各种零件,可转债套利策略就是赚取整体和零部件之间的潜在价格差别的一种手段。大本营还是一些股票期权的做市商,直接跟华尔街银行叫板。

大本营集团的电脑系统非常先进,格里芬常常说该基金的电脑系统使其能够在市场上稳稳站住脚跟,因为它丝毫不逊于华尔街的各大银行的系统。有了电脑系统就能够支持基金复杂的研究部门,也才能够应付大量的高速交易。大本营的一位高管在接受彭博采访的时候说:“从很大的意义上来看,大本营都是一个科技公司,只不过正好是从事金融投资的科技公司。科技系统在我们这里不是成本,而是我们的立命之本。”我们又想起了谷歌公司。正是因为电脑的重要性,大本营集团办公楼的楼顶有公司专用的发电机组,地下室有专用的油库。计算机房里面有专门的气泵,能在火灾的时候将氧气抽去。集团在另外的一个地点还有备用的全套电脑设备,整个公司在紧急情况下可以搬过去继续交易。

大本营集团的收费方式跟其他对冲基金不太相同,它从投资人的投资回报中抽成20%,然后将公司所有的成本再从投资人的回报中收回来,公司成本平均每年大约占到投资人回报的3%~6%,和收管理费的对冲基金相比较,这算是比较高的,但是投资人过去都是耸耸肩,用花生米和猴子的比喻来解释这个问题。

大本营集团也雇用将近100名博士,这些人过去也都是数学教授或者天体物理学家之类的角色,他们坐在大本营集团在芝加哥办公室的一角,号称“博士角”。那边到处都挂着从地板到天花板高的可以擦的白色写字板,上面都是密密麻麻的公式。西蒙斯的复兴技术在大本营也有投资,西蒙斯说:“大本营的回报不错,虽说不是出类拔萃,但是这家公司控制风险的能力很强。”

格里芬在接受采访的时候说起对冲基金行业的竞争,他说:“现在进来的钱越来越多,回报不可避免地越来越低,所以也促使我们不断尝试新的东西。”2001年当安然公司破产之后,大本营杀进了能源交易市场,现在基金有数名气象学专家,帮助交易员交易天然气、石油等能源产品。格里芬最近几年对中国也非常感兴趣,他在接受采访的时候说:“上海人在稻田里建起了一座纽约城。”他又补充说:“如果一种东西在别人还没有搞清楚之前你学会了,市场就会奖励你。”

跟学究气很浓的西蒙斯完全不同,年轻的格里芬在大本营集团内营造很强的竞争气氛,所以人员的流动性比较大,大本营集团被人戏称为芝加哥的“旋转大门”出来进去的人像走马灯。但是格里芬对这一点不以为然地说:“在这里工作的确很难,方方面面的要求很高,而且我们从不松懈。但是我很高兴我们有这样很硬朗的名声,因为我们就是要成为最好的、最强的。”

2008年间,市场传闻大本营集团要倒台,因为数家它的交易对手银行都要求大本营集团增加抵押资产的金额。《华尔街日报》在2008年11月报道说:“大本营最大的一只对冲基金当年亏损超过40%,大本营正在和给基金借钱的高盛、德银和美林银行商量对策。”12月,该报又追加报道,说基金11月又亏了13%,年度亏损达到47%,许多投资人要求赎回。2008年年底大本营暂时停止基金赎回。这种基金停止赎回的做法在金融危机中不算出格,而且也是基金条约里面允许的。

格里芬当时在接受采访的时候说金融危机提供了他交易生涯20年中最好的投资机会,他说:“我们对我们投资组合中的各种资产和仓位充满信心,在未来的年月中,它们一定会大放异彩的。”格里芬还补充说大本营集团的做市商部门在危机中也表现异常出色,他认为这部分生意也将有突飞猛进的发展。大本营的投资人是不是因为格里芬这些话而有所定神现在还不得而知,但是有些人则不无讽刺地指出梅里韦瑟在长期资本管理垮台之前,1998年的9月给合伙人的信中曾这样说:“我们最好的几个交易策略机会大好,这些仓位我们的基金都将坚守。”几天之后,樯橹灰飞烟灭。

据说格里芬基本上没有业余时间,除了工作,还是工作。唯一的例外是收集艺术品,尤其是印象派的画。他曾经出价6000多万美元买了塞尚的一幅画,创下当时的纪录。2004年他和夫人被一本杂志评为全球最活跃的10位收藏家之一。

收藏家科恩

但是要说起艺术品收藏,格里芬难以与SAC资本公司的斯蒂文·科恩匹敌。科恩2000年开始收藏艺术品,2002年以后就被年年评为全球最活跃的10位收藏家之一,有人计算他已经花了7亿美元购买各种艺术品,其中包括英国前卫艺术家赫斯特的代表作“死亡在活着的人心里的不现实性”。这个作品就是把一头死掉的鲨鱼泡在一个灌满了福尔马林的大鱼缸里面,科恩为此花了800万美元。

另一则有趣的故事发生在2006年,科恩要出1.39亿美元从赌博业大亨韦恩那里购买毕加索的一幅名画。这幅画画的是毕加索的情妇,头偏向一边,分成两半,一半是头,另一半则是男人身体的某个部位。如果这笔交易做成的话就将创下油画交易的历史纪录。就在油画马上要被运走的前一天,韦恩在拉斯韦加斯的家里给几个熟人看这幅画,也许是要道别吧,他一不留神用肘部把价值连城的画布捅了个窟窿,据说韦恩眼神不好。在闯了祸之后,韦恩平静地对几个客人说:“感谢上帝,闯祸的是我。”如果有人需要给亿万富翁或者超级亿万富翁下个定义的话,这句话就足够了。后来这笔交易取消了,韦恩仍然持有这幅补过的画,韦恩夫人说这是上天的旨意让他们把画留住。

科恩的基金公司SAC是以他的姓名缩写命名的,规模大约是160亿美元,不算最大,但是他的管理费也是令人瞠目结舌的:年管理费3%,表现费50%。他的交易策略最主要的是股票多空交易,这跟统计套利类似,也是快速大量交易。该公司的交易量也常常占到美国纽约股市和纳斯达克股市交易量的1%~3%。科恩还持有中国互联网搜索引擎公司百度7%的股份。

出生于1956年的科恩十几岁就开始着迷于跟投资、股市相关的各类问题,在宾夕法尼亚大学沃顿学院读经济学本科的时候他就已经是个股场老手了。1978年毕业以后他直奔华尔街,在一家经纪公司的期权套利部门任交易员。因为成绩出色,很快他就有了自己的团队从事交易。1992年他成立了SAC。

SAC的规模虽说不是最大的,但它在股票多空交易这个领域被公认是最好的,它的交易通常会影响到某只股票的价格形成。因为交易量巨大,每年SAC仅仅是付给券商的交易手续费就超过1亿美元,是华尔街银行最重要的主顾之一。《商业周刊》曾经撰文说科恩是“华尔街最有影响力,但是你可能从来没有听说过的交易员”,也有人说他是交易场上的兰博。其实他真人带着眼镜,个子不高,头也开始秃了,一点儿也不像《第一滴血》里面史泰龙演的满身肌肉的兰博。华尔街对科恩投桃报李,据说在科技股泡沫期间一些华尔街银行分配给他很多炙手可热的首发上市股票。

市场有很多传言说SAC常常会想尽办法,探听对手的策略和头寸,然后抢占先机。还说它有时候假买真卖;有时候扫尽街货;有时候则突击买入某只股票,令沽空的对手被迫平仓。量化投资策略其实仅仅占了该公司策略的一部分,但是由于公司的交易方法和西蒙斯、肖尔、格里芬的交易手法类似,而且它所收的管理费和西蒙斯一个级别,所以在提到西蒙斯的时候人们也会常常提到科恩和SAC。

如果要从这几家超级量化投资公司中寻找共性的话,那就是一个“快”。这不是偶然的,我们下一章要专门来看这个问题。

但是如果因此而总结说:量化基金就是把很复杂的模型用很强大的电脑系统运算出来然后用电子交易的方法风驰电掣般地完成则有失偏颇,因为也有坚持使用比较简单的量化模型的基金,这其中的一个很好的例子就是约翰·亨利的量化基金。

波士顿红袜和亨利

亨利生于1949年,加州大学哲学系肄业,所以在学术上不能和我们前面提到的诸多人物相提并论,据说没有拿到学位的原因是他读书的时候花很多时间先后在两个摇滚乐队排练演出。虽然在行业内很有名气,但是很多人知道他是因为波士顿著名的棒球队红袜。

2002年,亨利和几个伙伴买下了这支球队。当时他说购买红袜是为了打破一条已经有80多年的魔咒。波士顿红袜在1919年将棒球历史上最富传奇色彩的明星球员鲁斯卖给了纽约扬基队,所以魔咒说它100年也赢不了全美棒球联赛总决赛的冠军。据说这是鲁斯当年听到自己被高价卖掉之后气愤不已而说的话,但是史学家考证之后对该说法的出处也不置可否。1919年之后,鲁斯所在的扬基队所向披靡,屡夺冠军,而红袜则一蹶不振,屡战屡败。2004年,亨利和伙伴持有的红袜队在联赛阶段与扬基冤家路窄,红袜先输3场,接着上演惊天大翻盘,连赢4场,打败了扬基。接着它又在总决赛中夺冠,1986年后首次夺得总决赛冠军,亨利的“一生要做成的100件事情”的单子上又多了一个勾。

亨利很早就开始交易大豆和玉米的期货,1976年开始摸索使用量化投资方法。1981年用他的姓名缩写命名的JWH公司正式开张,为散户客户提供理财服务。这家公司的诞生远远早于后来壮大的对冲基金行业,在很长的一段时间内,它都算是全球最大的、面向散户的另类投资公司。

JWH使用事先设计好的规则进行投资,他的规则就是要捕捉到各种价格里面的趋势和趋势反转。它的规则基本不变,用公司的宣传资料上的话说,这样是为了彻底消除人的感情因素的干扰,消除人们对宏观经济各类指标充满主观因素的解读。JWH的仓位只是依照机械的规则,按部就班。在公司鼎盛的时期,他所管理的资产超过38亿美元,过去丰厚的回报也使亨利积累了大量的财富,能够有购买一个著名球队的实力。

JWH的主席在2003年说:“我们公司的策略在过去很少有什么变化。20年前的模型现在仍然在运作。当然现在我们交易的工具及市场与20年前相比已经不同,我们也添了一些新的模型。但是和许多竞争对手相比,我们没有做任何显著的更改。市场关注的信息可能在不同的时代有所不同,20世纪80年代是货币供应量,20世纪90年代是失业率,但是我们认为投资人对市场信息的应对方式并没有什么变化。正是因为未来的不确定性,价格才会有趋势,而趋势则正是我们要捕捉的。即便现在信息传递更好更快,但是人们分析这些信息的能力并没有什么变化。我们正是要寻找人们对信息反应的过程中的偏差所带来的机会,这些机会都是反映在价格趋势里面。人们的反应偏差也是很稳定的,所以我们的模型不需更改。”

亨利本人也说过类似的话:“我不认为我是唯一一个不能预见将来价格走势的人。没有一个人可以始终如一地预见未来,尤其是投资者。即便如此,投资人仍然希望或者相信他们能够预测未来的价格走势,或者他们相信其他的人有这种能力。很多投资人认为自己能够判断下一个经济周期的准确时间。对JWH来说,我们的出发点正是这一点:很多投资人都很自信能够预判将来。我一直认为,正是由于别人有这种自信,我们才能够持续赚钱。就这么简单。”

亨利将他过去的成功总结成4个理由:“发现长期趋势,不去理会短期的波动;坚持使用量化模型投资,将人工干预降到最低;积极采取风险管理策略,包括止损;全球分散投资。”

2005~2007年期间,许多市场价格都在区间波动,趋势不见了。JWH的资金规模从2005年的38亿美元降到了2008年8月的248亿美元。市场上曾经有传闻说JWH在考虑跟其他基金管理公司合并,但是也没有了下文。经济危机开始之后,市场价格出现波动,JWH的回报又开始回升。

亨利的量化投资方法和前面说过的几位超级量化基金的投资方法的相同点是他们都是机械遵循电脑模型的指示交易,但是也有很重要的不同点:对JWH来说,“科技”因素不占主导地位。JWH数十年如一日,使用基本一样的模型,眼光只盯着一个指标:趋势。

追随趋势的投资模式——不管是使用模型的或者是使用画图的或者是完全靠判断的——应该算是整个行业最常见的投资方式,绝大部分的投资人,专业也好业余也好,都会参考最近的价格走势决定是买还是卖。正是因为这个原因,投资行业里面有一句常说的话:“趋势是你的朋友。”意思是说当趋势来了之后你可千万不能站在趋势的对面,否则只会被像压路机一般轰隆隆的趋势碾死。金融学术界通过长期的分析结果证明追随趋势投资的确能获得一定的回报,所以有人也把趋势当成是一个回报因子,这一点我们在介绍法玛的有效市场假说的时候说过。但是最近几年也出现了许多新的学术研究,使用比较先进的统计方法和比较完善的数据库,它们的结论是:使用趋势赚钱的黄金岁月可能已经过去了。其中的主要原因正是趋势投资方式过去的成功:太多的钱追随趋势,虽说趋势还在,但是要想持续、稳定地赚钱则很难。西蒙斯也说起过这个问题,说商品价格的长期趋势要么不见了,要么很难从趋势中赚到钱。JWH过去几年的困难是另外的一个例子。趋势还在,只不过趋势变成了敌人。

有趣的是,在没有趋势的时候,正是由于很多投资人要进行风险管理,他们所采取的止损措施使追随趋势策略赔钱。在价格刚刚上扬的时候,趋势追随者做多;随后如果价格产生波动,下跌一点儿,趋势追随者做多的部位开始出现亏损;他们开始采取止损操作,忍痛平仓,赔钱;这时候因为很多趋势追随者平仓,价格继续向下,一些趋势追随者开始做空;价格过度下跌,开始反弹;趋势追随着做空的部位开始亏损;忍痛止损,再次平仓,赔钱;因为很多趋势追随者平仓,价格开始上扬,趋势追随者开始做多……这样周而复始。所以到头来,价格在一个狭窄区间内上下徘徊,而趋势追随者追到的只是一堆止损以后的损失。

西蒙斯那样的基金关注的是更短时间内的趋势和反弹,所以没有普通的趋势追随者的那些靠天吃饭的弊病。

弗雷的个人履历

关于西蒙斯,除了我们前面说过的那几点之外,我们还能找到什么信息呢?联系采访肯定是做不到,即便能联系到的话我们前面也看到过西蒙斯是如何守口如瓶的。一个偶然的机会使我们发现了西蒙斯的左膀右臂之一弗雷的个人简历,这份简历在一定程度上印证了我们前面的猜测,所以我们就再回过头来说说弗雷这个人吧。

弗雷的上一辈人里面没有一个大学生,他自己则获得石溪大学应用数学和统计学的学士和博士学位,用中国人的说法,他应该算是家族的荣耀。但是他攻读学位整整花了12年的时间,因为这两个学位他都是通过业余时间来完成的。这期间,他曾经在国防分析研究院工作过,在那里认识了西蒙斯。在随后的10年中,他又给一连串的公司打过工。在他的简历里面他还列出了他和别人在纽约州开的一家餐馆,说这家餐馆赚的钱就是他读博士的奖学金来源。1987年他获得博士学位的时候已经是一家军事装备公司研究部门的小主管,下面管有25个人。那时他主管的一个项目是研究如何自动测试轰炸机复杂的电子设备是否有故障,这个项目的结果被用到美国最新式的海上轰炸机的设计上。

博士学位到手之后他加入了摩根士丹利的股票交易部门,设计开发当时很领先的量化投资系统。这个使用银行自营基金,依靠模型进行交易的小组是华尔街最早开始统计套利的部门之一,DE肖尔也在那里干过。

之后他和别人共同创建了开普勒金融管理有限公司,这家公司于1992年被复兴技术收购。随后的12年中他是复兴技术的董事总经理、执行委员会的成员和管理委员会的成员,全面负责复兴技术的研究和产品开发。所以要说谁最知道该公司最核心的秘密,除了西蒙斯之外,弗雷紧随其后。

2004年弗雷从复兴技术退休,成了石溪大学应用数学和统计系的量化金融学研究方向的首任学科主任。

弗雷是这样介绍复兴技术公司的:“复兴技术公司是一家量化投资管理公司,管理大约50亿美元的资产。公司的旗舰基金是大奖章基金,在过去的10年中平均每年回报超过30%。在我1992年加入的时候,大奖章的资产为1.1亿美元。复兴技术大约有250名员工,分别在纽约、长岛和加州伯克莱。”

然后他一个个列出了他在复兴技术的成就,因为我们可以从中看出不少复兴技术的模型发展状况,所以下面我们逐条解释一遍弗雷12年间在复兴技术的成就:

·组建利率研究部,并招聘人员。开发风险控制和利率标价方法,使用以预测性为主和以市场性为主的利率模型。他是复兴技术公司利率交易量化模型的总设计师。

市场性的利率标价方法一般是指通过使用布莱克-舒尔斯-默顿的基本方法(外加后续学者的新贡献),对收益率曲线建造模型,确定各个不同时间点的利率之间走势的关系,然后分析各种金融产品的价格。长期资本管理用的就是这个基本的交易模型,但长期资本管理采取的投资策略是判断各种产品的市场价格是不是和理论计算出来的价值相符,而复兴技术很可能是通过判断利率的短期走势(“预测性”的模型)来买卖相关产品。“风险控制”部分指的是总仓位的控制、多空的控制、各种部位相对大小和绝对大小的控制、各种止损措施,等等。

·开发、实施、营销和管理了复兴技术使用新模型的一档基金:“量股策略”(Equimetrics)。这档基金使用长期投资策略,低风险,股市中性(股票做多和做空的数量大致相等,所以跟大市波动的相关性不大。)。复兴技术原有的投资人主要是“高净值客户”(也就是通常所说的富人),新的模型主要是针对机构投资者而开发的,它是复兴技术原有量化模型的变种,在营运的第一年募集到7亿美元投资。2002年,该基金被收编进了大奖章,此前的年回报率为18%。

我们知道量股策略是从1999年4月开始运行的,它从1500只流动性比较强的股票或者优先股中由模型挑选出大约1000只股票,可能是做空,也可能是做多,整个投资组合的剩余风险(多的仓位减去空的仓位)通过使用股票指数期货来对冲。任何单一股票的权重都不超过整个组合的5%。这个策略的交易速度不是很快,每年的换手率在1~3倍之间,杠杆也只有2~3倍。

量股策略应该算是股票多空策略的一种,但是交易的频率比通常的多空策略要稍微低一些,它是下面将要说到的统计套利策略的慢速版本。西蒙斯在谈起量股策略基金的时候说:“他们选股的模型也是在数据堆里面寻找重复性的规律,然后他们问自己:这些规律和市场运作、投资人的心理能不能挂上钩?如果能的话他们就按照新的规律改变选股的策略。”

在前一章引用的西蒙斯致投资者的信中他提到了“基本系统”,这个基本系统就应该是在量股策略的基础上演变出来的。西蒙斯通过模型的运算,挑出两组股票来,分别做多和做空,做多的部分是整个基金值的170%左右,做空的部分是70%,两者加起来,整个基金的股票净值接近100%。通过模型的仔细挑选,西蒙斯认为这个基本系统能够和标准普尔500指数的回报相当,也就是能够匹配大市的回报,但是因为有多有空的原因,基本系统的风险只有大市的2/3。这一点自然也是有悖于有效市场假说的:回报相当,但是风险只有2/3,这就是免费午餐。但是话又说回来,整个对冲基金的概念在某种程度上就是有悖于有效市场假说的:如果市场是有效的,谁也打不过市场,那么对冲基金的管理人凭什么打败市场呢?

·开发了“超新星”(Nova)基金所使用的投资策略,该基金是一个交易积极、市场中性的美国股票基金,使用统计套利策略。在1995年2月之前组建、管理该交易小组,包括为交易小组招聘人员。在策略的试营运期间,回报超过40%。1997年该基金策略被收编进了大奖章基金。

这个快速交易的统计套利策略和我们前面提过的其他3个超级量化基金的策略基本一样,所以我们不能不说说统计套利究竟是怎么回事儿。在本书的前面我们曾经提到过一次统计套利的概念,说任何通过统计方法多次交易之后预期能够获利的交易方式都算统计套利,我们也提过比较狭义的统计套利的定义,接近于股票多空交易,这里要专门说的是狭义的统计套利的操作。

按照罗闻全教授的定义,统计套利指的是根据股票具有快速波动之后回归本来价位的特性,从一个可能包括成百上千只股票的组合里面,使用量化模型方法,挑选合适股票,进行相关多空的交易方式。这种交易方式的持有期一般很短,可能只有几天,甚至几秒钟。采用统计套利操作的基金需要拥有相当强的计算、交易和科技实力。统计套利和多空操作有相似之处,多空操作一般看一对类似的股票,如果其中一只在一段时间表现超过另一只,那么表现差的一只在将来很可能会赶上表现好的一只,所以应该买入表现差的一只,沽空表现好的一只。统计套利把这个原则用到包含千百只股票的组合中去,通过给各种股票按照一定的原则打分来决定哪些做多,哪些做空,然后再使用马科维茨的理论来确定做多多少、做空多少,从而降低整个组合的风险。打分的原则多种多样,每个基金都不同,各个基金都视其为自己最绝密的绝密,但是一般可能包含超前或滞后的信号、技术分析里面比较大的阻力线或者支持线(比如说股票价格突破一个大的整数价位)、公司特有的兼并之类的消息以及短期趋势等。

统计套利操作需要复杂的计算,而且需要不断调整仓位,交易量很大,所以一般基金要能使用自动交易手段来减少人工带来的误差和延误,而且基金通常会采取各种其他措施来降低交易成本。正是因为这种策略的巨大交易量,所以投资银行刚开始都把使用这种策略的大基金视为财神。但是投资银行慢慢也发现这个财神有着阴暗的一面,因为财神开始直接和投资银行竞争,不过这是后面要说的话题。

2006年有一个叫布克斯达博的人写了一本叫《我们自己设计的魔鬼》的书,讲的就是20世纪80年代这种交易策略如何在摩根士丹利诞生的故事。布克斯达博是麻省理工学院的经济学博士,曾在多家很有名气的对冲基金和投资银行做过量化投资和风险管理的工作,包括10年在摩根士丹利,所以对这种策略的内幕了如指掌。别忘了弗雷在20世纪80年代曾在摩根士丹利的相关部门待过,他在简历上写道“在某投资银行改进其某种投资策略,使其的回报提高25%”,说的应该就是摩根士丹利和统计套利策略。布克斯达博在书里还讲到了另外一位超级量化基金管理人肖尔如何离开摩根士丹利,自己另起炉灶、使用这种策略交易的故事。所以,很多家公司所采用的这一类统计套利的策略或许都能追溯到摩根士丹利。这种“策略扩散”现象在对冲基金行业其实比较普遍:某种策略在某家银行或者基金诞生,如果运作很成功的话,不久就会有人出去自己开新的公司,复制这种策略。新公司的成员不久之后有可能跳槽,开自己的公司。没有几年的工夫,这种策略就到处都是。一个必然的后果是策略的回报下降,因为有效市场假说将获得最后的胜利。

在《我们自己设计的魔鬼》里面,布克斯达博是这样总结的:2002年以后,统计套利策略的表现开始滑坡,此后标准的统计策略(一个比较简单、比较标准的统计套利策略是这样的:首先选定一定数目的股票;计算方差——协方差矩阵(如果选了1000只股票,这将是一个1000×1000的大型矩阵);计算矩阵的特征向量和特征值;选取含有最大特征值的那个向量,预测该向量未来走势;计算所需要的多空股票组合。)一直也没有起色,其中主要的原因是有太多的钱在追踪这个策略。罗闻全教授的模拟运算证实了这一点,他说最近几年如果还想取得20世纪90年代前期的回报,那么杠杆必须增加2~4倍。但是,罗教授和布克斯达博说的是标准的策略,从事统计套利的各家基金都有各自不同的绝招,很可能有几种策略仍然在为它们的主人提供着印钞机的功能。但是我们知道,这是长不了的。从长远来看,有效市场假说将笑到最后。不过,在那之前,这些策略可能会使为数不多的几个人赚很多钱。

因为这种策略越来越流行,很多股票的短期价格走势在很大程度上受到统计套利交易的支配,所以市场上有这样的说法:“这只股票被统计套利给套上了”。如果被“套”上的话,这只股票的交易量会相应增加许多,它的价格走势也可能比较古怪。

超新星基金起初只是交易纳斯达克上市的股票,完全采取电子交易方式。20世纪90年代中叶,超新星基金的交易量占到纳斯达克相当大的份额,1997年有一天它的份额曾经达到14%。

从这个数字上我们还可以大致猜测一下大奖章基金的周转率和每笔交易的预期回报:假设它的年交易量是纳斯达克的5%,纳斯达克年交易量大概是10万亿美元,大奖章在纳斯达克的交易量就是5千亿美元,我们假定纳斯达克的交易量占到大奖章整个交易量的一半,它的年交易量为1万亿美元,但是一来一回算一笔交易,它的部位总额为5千亿美元,大奖章的资产是50亿美元,毛回报假定为80%,一年的利润应该是40亿美元。拿40亿美元除以5千亿美元得到0.8%,也就是说,它每笔交易的平均回报只有0.8%,这就是西蒙斯说的“小的机会”。拿5千亿美元除以50亿美元的资产得到100倍,意思是大奖章的年周转率为100倍,对共同基金来说已经超高了,但是对于高速交易的量化基金并不出奇。这当然是个非常粗略的猜测。

从弗雷的这段话里我们还可以看到这样的词——“试营运”。这在量化基金里面是比较常见的:有一个新的量化模型,在纸上很漂亮,但是在实际操作中如何呢?有很多统计、数学方法可以增强人们对某个量化标准的信心——光是看过去的模拟表现是很不够的——这一点我们在后面再详述。但即便是采取了种种方法,这些模型到了真枪实弹的战场上的表现谁也说不准,所以在实际操作中一般都会试营运一段。等到真实的表现和纸上的表现具有一定的可比性之后,才会加码。

另外一个值得注意的方面是上面两条提到的“收编”进大奖章的说法。这在量化基金操作中也很常见,因为已有的模型通常会“疲劳”,所以量化基金都有庞大的研究队伍来不断探索寻找新的模型。一旦经过试验之后某个模型的回报比较好,这个模型就会被收编进来。与此同时,老化的模型有可能被淘汰掉。这个过程其实需要很多经验,不可能是完全量化的。

·设计和管理实施了一项自动交易系统。

提出了模型框架,组织研究团队将现代投资组合管理理论和技术性投资相结合,设计出新的证券交易模型。这个项目成了上述“超新星”基金的基础。

“现代投资组合管理理论和技术性投资相结合”,就是我们上面说的统计套利,我们也知道它的源头是摩根士丹利。

·提出了风险管理模型,用于当时只有6000万美元的期货和债券基金。

在模型提出之前,平均回报为26%,提出之后,1991年回报为34%,1992年为39%,1993年为39%,1994年为71%,1995年为33%,1996年为32%。同期基金规模增加到8.8亿美元。

我们将上面的回报和大奖章的历史回报相比较,可以肯定,这个“期货和债券基金”指的就是当年的大奖章。我们可以推断,弗雷加入了之后大奖章才有了比较系统的风险管理模型:止损、杠杆管理、仓位分配等。风险管理模型是人们看量化基金的时候容易忽略的一个方面,人们通常只是关注模型是如何选股、如何预测的。其实军功章的另一半在貌不压人的风险管理模型里面:什么价位给某个仓位止损,投资组合出现何种亏损时给整个投资组合降低杠杆或者止损,各种模型的权重如何分配、如何调整,整个投资组合的杠杆如何调整,等等。这都会直接影响到基金的回报和风险,但是也常常被人忽略。

关于大奖章

所以,从以上弗雷对自己成就的描述中我们可以看出大奖章的历程:

·首先是通过统计信息分析方法来判断外汇和债券短期的价格变化,尤其关注过激反应的一类。

·在这个基础上加入了风险控制模型。

·之后又引入了统计套利,开始高速交易大量股票。

·接着又引入了统计套利的变种,低速交易大量股票。

·继续引入其他模型,分析像现价交易指令表这样的不太常用的数据来源。

这就是大奖章。

当然,复兴技术的上百名专家不是天天坐在那里看电脑的。他们每天都可能提出新的想法,对已有模型的改进和补充肯定是在不断进行的。但是提出一个崭新的模型则需要时间,这通过弗雷12年在复兴技术的成就中不难看出来:12年也不过是两三个模型而已。

退休以后,弗雷除了忙石溪大学新的量化金融专业的事情之外,还从事很多慈善工作。他设立的弗雷基金会帮助家庭背景有问题的少年儿童,为他们提供教育及其他服务。

他在石溪大学的量化金融专业能不能培养出新的西蒙斯呢?这是个疑问。

本书由“ePUBw.COM”整理,ePUBw.COM 提供最新最全的优质电子书下载!!!