Local EPUB Text
价值回归
如果把在市场中交易看成一个长期持续的游戏的话,有两种基本策略可以让我们赚钱。
第一种方法就像抛硬币赌输赢,每一次的成功概率为50%,如果每次盈亏的金额相同,长期玩下去基本上不赚不亏打个平手。在这种成功概率之下,我们只有改变支付 (支付是指参与者得到的期望效用水平)才可能获得理想的结果。还是拿抛硬币举例,假如每次赢的时候可得200元而输的时候只需支付100元,那么这个游戏就会非常吸引人。技术分析方法的所有成功几乎都是建立在这样的方式之上。因为通过计算机回验已经能够证明人类凭借形形色色的图形信号作出的交易判断的成功概率和抛硬币没什么两样。所以技术分析方法强调止损的重要性,其本质就是尽量减少在判断错误时的支付,从而获得长期的收益。
另一种方式就是提高成功的概率。提高每一次投资的成功概率,对长期结果的重要性是不言而喻的。不仅投资是如此,人生也是如此。
我认识一个小伙子,他总是逃避艰苦的学习,并相信一个人即使没有文化、没有知识、没有才华也一定有成功的机会。为了让他高兴,我当面同意了他的观点,并用我了解到的知识证明了他的说法。
我告诉他:“有社会学家做过一个研究,发现人的文化、知识、才华与成功之间的相关度 并不是很高,只有20%。这意味着,如果每个人的其他机会是均等的(长期来看我也相信是这样),比如好运气和坏运气各是50%,世界上最有知识和才华的人就能在这50%的成功基础上增加20%,那么他的成功概率是60%;那些最笨、最懒、最不学无术的人也只会在这50%的成功基础上减少20%,他们的成功概率仍有40%。差别不算太大。”小伙子笑眯眯地、心满意足地听我说完,并踌躇满志地深深吸了口气。看来他真把自己当成那40%之内的人了(又一个过度自信的实例)。
不过我还有一些话没有告诉他:人生并不是一次性博弈,而是一个持续、长期、不间断的博弈过程。如果每一次成功或失败的支付是相同的,那么拥有60%成功率的人的长期的、必然的结果就是成功。那些只有40%成功率的人生也必然是失败。
套利者遵循的就是提高成功概率的游戏方式。
既然可套利的商品的比价值呈现出正态分布的特征,我们就可以用历史数据计算出比价的均值和方差,并且可以依据“正态分布概率积分表”来判断当前比价是不是一个“好机会”。所谓好机会,就是在此点进行套利交易比价回归均值的概率远大于比价继续扩大的概率,简单地说就是“成功”的概率远大于“失败”的概率。
我们举例介绍这个过程:
拿郑州商品期货交易所的强麦(2013年5月后称为郑麦)期货合约和大连商品期货交易所的玉米期货合约为例。2003年3月31日强麦期货在郑州商品期货交易所上市,2004年9月22日玉米期货在大连商品期货交易所上市,从这一天起我们就能够获得强麦与玉米的比价,到2011年9月4日我们总共积累了1699个交易日的平均比价。
第一步,根据这些数据我们做出了强麦与玉米比价的直方图(见图4-5)。通过视觉观察,我们相信这个比价的分布符合正态分布的特征(人与机器的区别之一是人具有视觉,可以快速发现事物的特征)。
第二步,通过对1699个数据的计算,我们可以得到这个正态分布的均值和方差。目前强麦与玉米比价的数据均值为1.224,方差为0.100。这是两个非常重要的数据,因为根据正态分布的特征可知:正态曲线下,横轴区间(μ -σ ,μ +σ )内的面积为68.268949%,横轴区间(μ -1.96σ ,μ +1.96σ )内的面积为95.449974%,横轴区间(μ -2.58σ ,μ +2.58σ )内的面积为99.730020%。如图4-14强麦玉米正态分布图。
图4-14 强麦玉米正态分布图(2004年9月22日)
我们可以这样来理解:比价值落在均值加减1个方差范围内的几率约为68%;比价值落在均值加减2个方差范围内的几率约为95%;比价值落在均值加减2.5个方差范围外的几率小于1%。以前是这样,将来也有可能是这样。本例中,均值加减1个方差的范围是从1.124到1.324之间;均值加减2个方差的范围是从1.024到1.424之间。
第三步,观察当前比价,根据比价与均值的关系决定套利交易的方向。这很简单,我们的比价是由强麦价格/玉米价格得来的,如果当前比价小于均值则说明相对于玉米价格强麦的价格可能被低估,所以套利方向应该是买入强麦,卖出玉米,长期来看以后出现的比价大于当前比价的概率将大于比价继续缩小的概率。反之,如果当前比价大于均值则说明相对于玉米价格强麦的价格可能被高估,所以套利方向应该是卖出强麦,买入玉米,长期来看以后出现的比价小于当前比价的概率将大于比价继续走高的概率。
第四步,根据“正态分布概率积分表”判断套利交易“成功”概率。比如,2011年9月14日当天,强麦与玉米的比价为1.158,这个比价小于1.224的均值,这说明套利交易的方向是买入强麦,卖出玉米,但是我们有多大的机会成功呢?查“正态分布概率积分表”可知,比价高于此数值的概率为63%,低于此数值的概率为37%。这似乎是个机会,但接近40%的资金回撤可能性并不是套利者希望看到的,他们会继续等待,如果能换一个角度思考,更好的机会至少有37%的概率出现,现在急于交易可能产生的不良结果,会由于耐心而变成未来的良机。
在2012年1月11日,强麦与玉米的比价降至1.047。查“正态分布概率积分表”可知,比价高于此数值的概率大于96%,低于此数值的概率小于4%。非常好,这正是套利者等待的机会。虽然没有人能够准确、具体地预言未来,但在一个较长的时间段内我们能够对事态发展的可能性作出预测。
需要提醒大家注意的一点是,在对某一天价差概率作判断的时候,要依据在此之前所能得到的所有数据计算均值和方差,并绘制正态分布图。原因是,以往的数据只能告诉我们过去的分布,而不是完整的规律,每一天都在变化之中,数据越多,我们才越接近真相。
从另一个角度来说,当数据很少时,我们必须谨慎面对。比如郑州商品交易所的菜油、油菜籽和菜粕这三个品种,从理论上来看,它们之间的关系如同大豆、豆油和豆粕,油菜籽是原料,菜油和菜粕是产品,是天生的可套利品种。问题是,油菜籽和菜粕期货合约仅从2012年12月28日才上市交易,到2013年9月不足200个日交易数据,我们尚不能从这么少的数据中发现它们之间的统计规律。我的建议是,没有3年以上的价格数据作为支持,不要轻易参与一个套利机会。
第五步,唯一要做的就是行动。能做而不做、见机而不举,那是懦夫。之后的结果我们在第二章中已有过介绍,这里就不重复了。
所谓好的时机就是那种风险小而收益大的时机,概率分析会清晰地告诉我们什么时候出现这样的时机,并能够(至少是近似地)量化风险和收益的可能性,从而增强我们对市场情绪和噪音的免疫力。
套利者相信自然规律,相信事物会回归 其基本的运行规则,相信两个商品之间的比价有回归其均值的趋势。
回归最初是遗传学中的一个名词,是由英国生物学家、统计学家高尔登首先提出来的。他在研究人类的身高时,发现高个子父母的子女身高有低于其父母身高的趋势;而矮个子父母的子女身高往往有高于其父母身高的趋势。从整个发展趋势来看,高个子回归于人口的平均身高,而矮个子则从另一方面回归于人口的平均身高。回归这一概念,从此便一直为生物学和统计学所沿用。
在统计分析中,回归是一种研究两个变量之间关系的分析方法,目的在于根据已知的变量(自变量)来估计和预测另一个变量(因变量)的总平均值。例如,农作物单产与施肥量、降雨量和气候有着依存关系。通过对这一依存关系的分析,在已知有关施肥量、降雨量和气候信息的条件下,可以预测农作物的平均单产量。
很明显,套利商品的比价随着时间的不同,其值在前后期之间表现出一定的依存关系,长期来看,任何比价的过度偏离最终都将被时间修正,这是典型的自身回归模式。这一规律保障了套利的成功可能。
那么为什么比价会回归?
这是由套利商品之间的相关性所决定的。
经济现象之间客观上存在着各种各样的有机联系。相关关系 ,就是指现象之间存在着非严格放热、不确定的依存关系。这种关系的特点是:某一现象在数量上发生变化会影响另一现象数量上的变化,而且这种变化在数量上具有一定的随机性。也可以这么说,当给定某一现象一个数值时,另一现象会有若干个数值与之对应,并在总是遵循一定规律,围绕这些数值的平均数上下波动。其原因是,影响现象发生变化的因素不止一个。例如,影响豆油价格的因素除了原料大豆的成本外,还有加工成本、市场需求等因素。
相关关系按相关方向的不同,可以分为正相关 和负相关。 正相关是指两个变量之间的变化方向一致,呈一致增长或一致下降趋势。例如,消费品销售量与居民货币收入之间的关系。负相关是指两个变量之间的变化方向相反,即一个呈下降(上升)而另一个上升(下降)。例如,商品的价格与销售量之间的关系。
相关关系按相关程度的高低,可以分为完全相关、不完全相关 和不相关。 如果一变量的变量值完全由另一个或一组变量值所决定,这种相关关系称为完全相关。因此,完全相关也就是变量之间的一种确定的函数关系。如果一变量的变量值不但与另一个或一组变量值有关,而且受随机因素的影响,则变量之间的相关关系表现为不完全相关。如果一变量值不受另一个或一组变量值影响,彼此独立,则变量之间没有相关关系,即为不相关。
人们通常用相关系数来描述变量间相关强弱的程度。
相关系数一般用r 表示(有时也用ρ 表示)。r 描述的是两个变量间线性相关强弱的程度。r 取值在-1与+1之间,若r >0,表明两个变量是正相关,即一个变量的值越大,另一个变量的值也会越大;若r <0,表明两个变量是负相关,即一个变量的值越大,另一个变量的值反而会越小。相关系数的绝对值越大,相关性越强,相关系数越接近于+1或-1,相关度越强,相关系数越接近于0,相关度越弱。
知识链接:相关系数的计算公式
有一种常用的、无需复杂计算的方法,可以对于两个变量之间相关关系进行分析,这种方法就是相关图 法。所谓相关图法就是将具有相关关系的两列成对的变量值,在直角坐标图上标出每对变量值的散布点(坐标点),以其散布点的分布状况来判别相关形式、相关方向和密切程度的方法。例如,两变量之间的几种相关图形及差别方法如图4-15至图4-19所示。
图4-15 正相关关系(0<r <+1) 图4-16 完全正相关(r =1)
图4-17 负相关关系(-1<r <0) 图4-18 完全负相关(r =-1)
图4-19 完全不相关(r =0)
只要获得两个商品的价格数据,用散点图的方法立即可以直观地告诉我们它们之间的关系程度。以下就是我们用超过30年的价格数据绘制成的“美豆与美豆粕价格的散点图”以及“美豆与美玉米价格的散点图”,从这两张图可以看出大豆和豆粕、大豆和玉米呈现出高度的正相关关系。见图4-20,图4-21。
图4-20 美豆与美豆粕价格的散点图(1979年10月9日—2012年4月18日)
图4-21 美豆与美玉米价格的散点图(1980年3月31日—2012年4月18日)
假如某些人一定要自作聪明,试图寻找两个无经济联系的商品之间的变化规则(这也是常有的事,人类天生就喜欢寻找规律,这是天性),我们也可以利用相关分析的方法来验证这种努力是否值得考虑。我们用大连商品期货交易所的豆粕和塑料这两个商品来举例,将它们从2007年7月31日至2013年8月2日的价格数据绘制成散点图,如图4-22。很明显,从统计方法来看,要说两者之间有依存关系是非常牵强的。
图4-22 豆粕和塑料价格的散点图(2007年7月31日—2013年8月2日)
有一点必须牢记,相关性并不是因果关系,两个变量之间存在统计学关系,并不代表两者之间互为因果。就像我们在第一章中所提到的,大象和老虎的数量并不是犯罪的主要原因。在选择套利商品时,两种商品之间存在相关性是必要条件而非完全条件。
只有当两种商品既存在常识上的互为因果的关系,又呈现出统计学上的相关性时,它们才是合格的跨品种套利的选项。 这是选择套利品种的重要规则。不然,胡乱选择套利商品,哪怕侥幸获得一两次成功,也仅仅是巧合而已。