Local EPUB Text
大多数高频数据不包含买卖标识符
无论是Leve I或Leve II报价数据都不包含说明给定记录的交易是市价买单还是市价卖单的标识符,而一些应用要求买卖交易标识符作为模型的输入量。为了克服这个困难,在这里提出了四种方法来估计一个交易是根据Leve I数据的买入还是卖出:
·限价卖空规则(tick rue);[1]
·报价规则(quote rue);
·Lee-Ready规则(Lee-Ready rue);[2]
·整体交易量分类(buk voume cassification)。[3]
没有此类信息的数据集的时候,限价卖空规则是用于确定给定交易是由买方还是卖方发起的三种最流行的方法之一。其他两种流行的方法是报价规则和Lee-Ready规则,由Lee和Ready(1991)提出。最新的方法是由Easey、Lopez de Prado和O'Hara(2012)提出的整体交易量分类(BVC)。
根据限价卖空规则,交易的分类是通过比较交易的价格和前一个交易的价格进行的,不考虑卖价或买价信息。每个交易则被归为以下四个类别中的一类:
·如果交易价格高于前一个交易的价格,则为升标(uptick)。
·如果交易价格低于前一个交易的价格,则为降标(downtick)。
·若价格没有变化,但最后的变化记录为升标,则为零升标(zero-uptick)。
·若价格没有变化,但最后的变化记录为降标,则为零降标(zero-downtick)。
如果交易价格与先前交易的价格不同,根据价格是上升还是下跌,最新交易被分为升标或降标。如果价格没有变化,根据最后非零价格变化的方向,交易被分为零升标或零降标。根据Eis、Michaey和O’Hara(2000)的研究,1997~1998年,限价卖空规则正确地分类了所有纳斯达克交易的77.66%。图4-10对限价卖空规则做了解释。
图4-10 限价卖空规则示意图,用于将交易分类为买入和卖出
低比例的正确分类交易可能是由于股票监管问题造成的。例如,Asquith、Oman和Safaya(2008)的报告观测到的错误分类至少部分是由于法规要求股票卖空要在升标或零升标(被称为升标规则)情况下执行而造成的,美国证券交易委员会于2007年废除了这一规则。因为近30%的股票交易是卖空,所以Asquith等人(2008)认为,仅靠监管限制的卖空可能导致观测到的交易分类错误。在没有卖空限制的情况下,所有之前的交易分类可能会更加精确。在期货数据中,没有升标规则,Easey等人(2012)明确发现,限价卖空规则能够更准确地将交易分为买方发起和卖方发起。根据Easey等人(2012)的计算,限价卖空规则能够准确分类电子迷你标准普尔500指数期货的86.43%。
报价规则是另一种分类报价的方式,也是由Lee和Ready(1991)和Eis等人(2000)在论文中发表的。根据该规则,如果交易价格高于(低于)当前通行买卖报价的均值,则交易是买入(卖出);如果交易价格正好在当前通行买卖价的中值,则该交易不进行分类。虽然报价规则经常被使用,并且已被证明正确地分类了纳斯达克上所有交易的76.4%(参见Ellis et a.,2000),但是当前通行报价(prevailing quote)的定义可能有不同的解释,并且分析结果可能比限价卖空规则差。例如,Lee和Ready(1991)指出,报价和交易通常不排序,导致很难确定当前通行报价。具体来说,随着电子预定簿的引入,报价通常会在触发它们的交易实现之前就被记录了下来。他们建议通过在至少提前5秒钟使用报价来分类交易,以缓解这种情况。1991年,纳斯达克在报告交易时,延迟中值为5秒。然而,在过去20年里,自Lee和Ready的研究出版以来,市场速度取得了相当大的提升,该规则的有效性可能已经降低。图4-11为该报价规则分类的示例。
所谓的Lee-Ready规则,首先使用报价规则对交易进行分类。发生在当前通行买卖报价中价的交易,不使用报价规则进行归类,随后使用限价卖空规则进行分类。此外,Lee和Ready(1991)强调将交易与至少提前5秒的报价进行撮合,以避免错误的报价排序。Dufour和Enge(2000)遵循5秒规则,但Eis等人(2000)反对,他们认为交易报告延迟可能会根据终端用户的系统而有所不同。忽略5秒的延迟,Eis等人(2000)认为,Lee-Ready规则能够将所有交易的81.05%分类为买方发起或卖方发起,相对限价卖空规则有了小幅改善。
图4-11 报价规则分类的示例
为了进一步提高交易分类的准确性,Easey等人(2012)提出了一种方法,对市场买盘或市场卖盘产生的特定交易量进行概率估计。这一名为“整体交易量分类”(BVC)的规则,操作如下:对于每单位时间或数量[“交易量”(voume bar),可以为每100股交易],BVC将观测到的交易量作为买盘的概率如下:
式中,Vt是在时间或交易量间隔t期间观测到的总交易量;Pt-Pt-1是在两个连续的时间或交易量,t-1和t之间观察到的价格差;σΔP是基于顺序时间或基于交易量时钟的价格变化的标准偏差;Z是标准正态分布的概率分布函数。
买方发起的交易量可以估计为
根据BVC,市价卖单产生特定交易量的概率则变为
然后,卖方发起的交易量相应大小为
Easey等人(2012)将BVC方法应用于电子迷你期货,结果表明,在使用时间间隔时,BVC规则正确地分类了所有交易的86.6%,以及当使用基于交易量而不是基于时间时,BVC规则正确地分类了所有交易的90.7%。
总结
分笔数据与低频数据之间有着显著的差别。分笔数据的使用创造了很多低频数据无法提供的机会。多种抽样和插值技术创造了数据研究的多种角度。多种组织和解读细微分笔数据的方式传达了产生的时间序列不同的数据属性。
章末问题
1.高频数据的关键属性是什么?
2.什么类型的数据信息是最常见的?
3.什么数据抽样技术所产生的高频时间序列更符合正态分布?
4.限价卖空规则、报价规则、Lee-Ready规则和整体交易量分类的关键区别在哪?
5.思考一笔在时间t,以价格17.01执行,即在当前时间t的最优买价执行的交易。在这笔交易前,在时间t-1执行的价格为17.00。按照报价规则,交易在时间t应被分类为买方发起还是卖方发起?根据限价卖空规则,如何将在时间t完成的交易归类?
[1] tick rule规则禁止以低于当时市场最低卖价的价格进行卖空交易。——译者注
[2] Lee-Ready是CHARLES M. C. LEE和MARK J. READY在1991年发表的论文Inferring Trade Direction from Intraday Data中提出的根据成交价格推断交易的买卖方向的算法,该算法正确率极高,被称为高频交易的基石。——译者注
[3] bulk volume classification(BVC),是指聚集一段时间或一定数量的交易量,根据时间限制的起点到终点来决定买卖交易量的百分比。——译者注