Local EPUB Text
六、如何看待数据拟合
行文至此,我想有些对量化投资有所了解的朋友一定会说:为了将资金总投入控制在360000元左右,对买入参数进行修改,这是一种数据拟合!一个为了得到完美结果而过度拟合的量化模型对于实战是没有任何价值的。
我在此引出以上问题,是因为这种观点很具有代表性。而我们的量化定投模型从模型三开始会越来越多地涉及“数据拟合”问题。这个问题如果不讲透彻,估计很多人心里会对量化模型的实战能力打个大大的问号。
下面我谈谈我对这个问题的看法。
首先,我认为在量化模型的设计中,对于数据的过度拟合确实是一个非常危险的行为,很多人在设计模型的过程中自觉不自觉地都会陷入“过拟合”这个陷阱,最终导致模型历史数据上跑得很好,一到实战中完全熄火或者表现平庸。举个简单的过拟合例子。股民小明发现股票A过去2年一直在10元-15元这个区间震荡。他认真计算了一下,如果每次当A跌到10元就买进,涨到15元就卖出,2年下来收益率高达240%。然后小明据此提出一个量化模型,未来当股票A跌到10元即全仓买入,涨到15元即全仓卖出,预期年化收益率高达110%。大家看了肯定会笑,因为这个模型完全没有理论基础的支撑,对经验的总结又很片面,难以服众啊。
其次,我认为通过数据拟合来建立合理模型又是人们在生产生活中提炼经验总结规律的必然途径。我们来看下面这则关于天气的民间谚语。
久雨刮南风,天气将转晴
云绞云,雨淋淋
朝起红霞晚落雨,晚起红霞晒死鱼
天有铁砧云,地下雨淋淋
直雷雨小,横雷雨大
南闪四边打,北闪有雨来
月亮撑红伞,有大雨
月亮撑蓝伞,多风去
日落射脚,三天内雨落
西北天开锁,午后见太阳
大家想必对这些谚语都耳熟能详,也都认为这些谚语具有比较高的实用价值。那么这些谚语是怎么来的呢?答案一定是先民们通过长期的观察,总结出来的经验。在人类文明发轫之初,人们肯定对“打雷”和“下雨”之间建立不了什么联系。但是随着时间的推移,人们发现,下雨前往往会伴有雷声,久而久之,“打雷”这个数据就和“下雨”拟合到了一起。从而推导出一个经验模型:打雷后往往会下雨。
我们再来看一个例子。牛顿和万有引力的故事大家想必都知道吧。话说当年一个苹果砸在了牛顿的头上,从而让牛顿茅塞顿开,一下子发现了在当时可谓“真理”的万有引力定律。这个故事的真假我们已无从考证。但是牛顿从观测和实验入手总结出万有引力定律却是不争的事实。万有引力定律公式如下。
F:两个物体之间的引力,G:万有引力常量,M:物体1的质量,m:物体2的质量,r:两个物体之间的距离。
万有引力定律是牛顿在1687年于《自然哲学的数学原理》上发表的,这个公式涉及的4个变量唯独这个G也就是万有引力常量显得莫名其妙。牛顿当年虽然提出了这么一个参数,但是对于G的数值大小和作用并不清楚。万有引力常量一直到100多年后的1798年才由卡文迪许通过实验测量出一个比较准确的数值。我想牛顿当年对G的数值估计也是用“拟合”的办法,反复计算后给出一个大概的大小。限于当时的技术条件,肯定很不精确。在其后的200年间,万有引力定律一直被奉为物理学的“圭臬”,一直到爱因斯坦在20世纪初提出相对论后,人们才发现万有引力定律其实并不是一个万能的终极真理,也只是在一定的条件下才成立。但是,这并不影响万有引力定律的历史地位和现实作用。即便到了今天,万有引力定律依然是每个初中生踏入物理学所必学的一章知识。
第三,在股票市场上,任何能称之为“理论”“方法”的东西,其本质也都是对股票某些数据的拟合。道氏理论、江恩理论、波浪理论、随机漫步理论、缠论等等,哪一个不是从经验总结而成的呢。这些理论完备吗?是否可证明呢?
答案是:不知道。拿最有名的波浪理论来说吧,此理论由美国证券分析家拉尔夫·纳尔逊·艾略特提出,他认为市场走势不断重复一种模式,每一周期由5个上升浪和3个下跌浪组成。但是看过该理论的人都知道一句话:千人千浪。每一个波浪理论家,包括艾略特本人,很多时候都会受一个问题的困扰,就是一个浪是否已经完成而开始了另外一个浪呢?有时甲看是第一浪,乙看是第二浪。差之毫厘,失之千里。看错的后果却可能十分严重。一套不能确定的理论用在风险奇高的股票市场,运作错误足以使人损失惨重。
综合以上分析,我们能得出一个结论:数据拟合不可怕,数据拟合是我们发现规律构建量化模型的必经之路。任何的量化模型都是从数据的拟合开始的。如果拟合的过程符合市场内在规律或者说符合主流的市场理论,那么我们就有信心付诸实践。
回到我们的模型三,对于买入函数中参数的修改,仅仅涉及到金额的问题,买卖的信号本身并没有改变。而且我们坚定地认为未来的市场依然会潮起潮落,价格依然会围绕价值做上下波动。所以这种优化是没有问题的。在本书的后面章节中,随着对量化定投模型的更加深入的探讨,会遇到更多需要修正参数的机会。对于新加入参数以及修改参数,我都会本着审慎的原则,一切立足现实,谨慎运用拟合。