Local EPUB Text
机器学习
例如,受监督的Boosting算法,工作原理如下:一个独立变量Y,比如在一个特定的金融工具收益率时间序列中,配有一个函数G,表示Y独立于另一个金融工具X的依赖度,以及参数θ:
然后,Boosting错误类型的计算如下:
式中,Ist<>0是指示函数,当G(Xt,θ)与Yt准确匹配时,Ist<>0的值就为零;当εt不等于零时,Ist<>0等于1。时间序列Wt代表分配给每个观测时间的Boosting权重,其中第一次迭代时所有的权重均为1,在此后的迭代中按如下的公式计算权重:
式中,
这种机器学习算法最终产生一个函数G(Xt,θ),紧密贴近Yt。运行机器学习模拟的人类研究人员选择这样的训练及测试,和额外的预测等的参数。
机器学习算法可能会有一个致命的缺陷:缺乏经济基础的数据挖掘可能产生在过去稳定但长期看未必稳定的关系。这种偶然的关系被称为虚假推论,用来对因变量的未来行为进行预测是不可靠的。在本书成书之时,还没有机器学习算法可以超越其立即交易应用程序而智能化,所以也不会威胁到人类。
总结
本章讨论了常常表现为高频交易不良后果之证据的算法。如本章所述,围绕高频交易策略的大多数担心都是不必要的。不过,有些策略确实是高频市场操纵的直接结果,即便如此,这些策略也是可以筛选出来的,因此大大降低了所有市场参与者的风险。
章末习题
1.什么是潜伏套利?
2.假设IBM股票同时在NYSE以125.03以及在东京以125.07交易。从市场有效性的观点看,潜伏套利对IBM股价造成良性还是不良的冲击?
3.什么是价差剥头皮?什么是回扣获取?
4.什么样的分层挂单是操纵性的?什么样的是良性的?
5.我们如何发现拉高出货的高频操纵?
6.什么是机器学习?