Local EPUB Text
永久性市场冲击的实证估计
数据准备
市场冲击可以使用Leve I和Leve II的逐笔交易数据或者是含有交易时间戳的数据来估计。Leve II的数据可以精确定位限价订单与市价订单:特定价位上竞买数量增加意味着限价订单的到达;最高竞买价的流动性减少意味着市价卖单的到达。
当使用Leve I数据时,在区分是由买家还是卖家下单上会遇到困难。近年来,研究人员开发了一些方法来区分买卖订单:包括限价卖空、报价比较、Lee-Ready和整体交易量分类的方法,这在第4章已经讨论过。
基本估计模型
把买卖订单从数据中区分开后,就完成了估计永久性市场冲击的准备工作。在线性函数关系的假设下,永久性市场冲击可以使用下面的线性回归估计得到:
式中,t是交易的时间;t是该笔交易之后,衡量市场冲击的事件窗口内的交易笔数或时间单位数;Vt是t时刻观察到的交易规模;ΔPt,t是时刻t到时刻t之间的标准化的价格变化,可以用下式表示:
图5-8和图5-9显示了长期欧元债券期货(FGBL)在每笔交易后的5笔交易数据的系数估计值和(Adridge,2012c)。
图5-8 由买家发起订单交易的长期欧元债券,期货估计得到的截距估计值,2009~2010年
图5-9 由买家发起订单交易的长期欧元债券期货,估计得到的规模系数,2009~2010年
从图5-8和图5-9中可以发现,买家交易的5笔成交在市场冲击上同成交规模呈很强的正相关:图5-9的右坐标轴显示,的t值大多数都达到10,表示依赖成交量的显著性达到了99.999%。尽管市场冲击依赖于成交规模是高度可持续的。的估计值却非常小:从左轴可以看出,只有10-7,换句话说,对于每100份长期欧元债券期货的成交,每笔交易后的5笔交易平均而言只能推动期货价格上涨0.001%。每日观测到的结果基本相同,只是在每季度的季末,估计值的统计显著性降为0,而这有可能是展期所造成的。
图5-8画出了,这里的意味着那些无法由交易规模解释的,由买单促成的成交所导致的FGBL的平均增长。图5-8显示,左轴的值,平均而言为10-5,是交易规模系数的100倍。因此,如果只交易100份长期欧元债券期货,与交易规模无关的市场冲击完全超过了和交易规模相关的市场冲击。只有当交易量超过100份长期欧元债券期货时,才会产生依赖于交易规模的市场冲击。呈现较强的统计可持续性,从图5-8可以看出,对应的t值在5~20。由卖家下订单促成的成交也造成了类似大小的市场冲击,只是方向相反而已,这可以从图5-10和图5-11里看出。
图5-10 通过卖家订单成交的长期欧元债券期货估计得到的,2009~2010年
图5-11 通过卖家订单成交的长期欧元债券期货估计得到的,2009~2010年
式(5-7)对于由买家订单促成的成交的统计意义和解释能力比较低,从图5-12可以看出,通过调整模型的R平方测量,调整范围在1%~2%。为了将透视图中的1%~2%调整R平方,需要考虑广义自回归条件异方差(GARCH)的预测能力的调整R平方,广义自回归条件异方差是用于许多商业应用的流行波动率估计模型。如果把调整放在GARCH模型中比较,GARCH模型的预测能力只有5%,换句话说,尽管式(5-7)的解释能力较低,但是和其他主流模型相比,也不算太低。
图5-12 式(5-7)的线性市场冲击估计的阐释力
其他解释变量
式(5-7)截距的强显著性,让人不禁疑问:还有其他什么变量可以帮助解释。市场冲击的业务模型经常会增加一些其他的解释变量,比如观测到的价差、短期波动率和交易持续期。为了分析这些变量的影响,扩展式(5-7)如下式:
式中:
·和之前一样,ΔPt,t代表t到t这段时间价格的变化,
·vt代表t时刻记录的成交量。
·代表短期波动率,可以由几种方法估算,比如使用预先定义好的t时刻之前的一系列时间段的最高价和最低价的对数变化或标准差(Garman and Kass,1980):
·是每笔交易前t*时段观测到的平均价差。在含有报价的数据中,平均价差可以被定义为最优买价和最优卖价的价差:
·如果没有报价数据,可以通过假设区间段内的价格变化等于有效价差来估计。当买卖订单交替出现时,这样的假设一般都是正确的,因为市价买入是和最优卖价成交,而市价卖出是和最优买价成交。平均有效价差的表达式见式(5-9),Adridge(2012c)有一个近似的式子:
·最后,是连续两次交易之间的平均时间:
Adridge(2012c)使用FGBL数据估算了式(5-9)。发现对于FGBL,额外的这些解释变量确实影响了市场冲击,但是新的模型并没有降低截距项的统计显著性,或者改变βv,ι值。交易持续期的估计值,与Dufour和Enge(2000)的结论一致,即当交易持续期短时,市场冲击低。根据Dufour和Enge(2000)对于该观测现象的解释,这可能是因为越短的交易持续期越有助于信息逐步传入价格,进而导致了每笔交易的价格变化更小。
因果关系
从式(5-7)和式(5-9)中估计得到的市场冲击系数,受到以下几个方面的质疑:既然市场冲击的测度是根据每笔交易之后的若干笔数据得到的,是否有可能这种冲击是由之后其他几笔成交量决定的?例如,一笔交易的大小影响了之后几笔交易的方向和大小,进而夸大了市场冲击,看上去市场冲击好像是由于初始的交易规模造成的,而实际上则不是。
为了回答这个问题,可以使用向量自回归(VAR)模型(这和VaR模型不一样),VAR模型是由Hasbrouck(1991)提出的,之后由Dufour和Enge(2000)扩展改进。VAR模型回答了如下这个关键的因果问题:市场冲击是否会影响接下来的交易方向,或者说交易的方向和规模是否影响了市场冲击并夸大了这种冲击?此外,VAR模型允许我们检验辅助效应,比如在一天不同的时间里出现的持续的不规则现象。
Dufour和Enge(2000)的VAR模型可以写成如下形式:
式中:
·Ri是第i笔交易之后瞬时的市场冲击,通过计算一笔交易的对数收益率得到:
·Qi是第i笔交易的方向,Qi=1是由市价买单达成的成交,Qi=-1是由市价卖单达成的成交。Dt,i是关于交易时间的虚拟变量:
·bj和dj,是关于交易规模的函数:
式(5-15)计算了一笔交易之后的市场冲击:紧接着5笔交易之后滞后一笔交易的市场冲击,每笔交易的每日交易时间,与5笔成交同时及滞后的交易方向Q,以及Q和交易量的乘积QV。式(5-16)考察使用同样的解释变量能在多大程度上预测下笔交易的方向。换句话说,式(5-16)考察过去5笔交易的收益、交易时间、方向及规模是否可以预测下一笔交易的方向。
表5-1和表5-2分别显示了式(5-15)和式(5-16)的估计结果,样本数据采自2009年5月6日的长期欧元债券期货,这天是一普通的交易日,不过巧合的是该日正好是美股“闪电崩盘”前一年。
表5-1 VAR模型的OLS估计结果,式(5-15),对欧元债券期货(FGBL)交易分笔数据,2009年5月6日Ri
Dependent variabe is the one-tick return,Ri.T-statistics are reported in parentheses,bod-font vaues represent statistica significance of 99.999percent and higher.Source:Adridge(2012d).
如表5-2所示,瞬时市场冲击确实是由之前的成交、当时及滞后的交易方向、同时的交易规模这些因素所决定的。之前的交易规模对未来的市场冲击影响很小。时间虚拟变量系数的估计结果显示只有在10:00~11:00GMT这段时间是统计显著的。这意味着,在10:00~11:00GMT的交易比其他时间段的交易具有更小的市场冲击。这很有可能是由于价格趋势受宏观新闻的影响。有趣的是,回归的阐释力,调整R平方,达到了46.25%,这是个非常大的数字。
表5-2显示,显著决定将来交易的方向的因素既不是交易的规模也不是由过去交易产生的市场冲击(除了最近的那笔)。相反,接下去交易的方向几乎是由上一笔交易的方向、买卖订单所确定的,且完全独立于这些交易的规模和过去交易产生的市场冲击。具体而言,根据表5-3的估计,2009年5月6日,在FGBL的交易中,一笔买单之后有46.2%的可能仍然是买单;连续两笔买单之后有62.5%的可能仍然是买单;连续三笔买单之后继续是买单的概率达到了69.3%;而连续四笔买单之后接续是买单的可能性达到72.5%,这是一个非常大的数字。
表5-2 VAR模型的OLS估计结果,式(5-16),对欧元债券期货(FGBL)交易分笔数据,2009年5月6日,Qi
Dependent variabe is trade direction,Qi.T-statistics are reported in parentheses and bod-font vaues represent statisticasignificance of 99.999percent and higher.Source:Adridge(2012d).
时间虚拟变量系数的估计值仅在16:00~17:00GMT(美国东部时间上午11:00到中午ET)之间显著且为正,这意味着在2009年5月6日,买入FGBL的交易占大多数。式(5-15)和式(5-16)的估计结果显示,调整R2接近40%,说明这些变量具有较高的解释力。
一个值得深入研究的问题是,在一年后的2010年5月6日,即“闪电崩盘”发生之日,市场的环境是否发生了巨大的改变。表5-4和表5-5回答了这个问题:2010年5月6日(闪电崩盘),那些值和一年前的2009年5月6日相比,变化无几。
正如Adridge(2012c)所证明的,式(5-15)对于2009年5月6日的估计与“闪电崩盘”那日的估计值非常接近,这说明市场冲击模型在市场大多数环境下都表现得不错。Adridge(2012c)也证明了,式(5-15)对于样本外的预测表现出了稳健性,利用之前30分钟的交易数据估计得到的参数来预测市场冲击,可以达到99.9%的精准度。
总结
交易成本对于高频交易系统是个不可忽略的负担。在所有的成本中,市场冲击又是成本中占比最高的一项。理解和测量现在的成本结构对于设计可盈利的交易系统是必不可少的。
章末问题
1.金融市场有哪些成本?
2.什么是隐性成本?它和透明成本的区别是什么?
3.在当前市场哪类成本是占比最高的?
4.高频交易的交易员会面对哪一类税收结构?
5.什么是市场冲击?它为什么会存在?
6.一个市价买单之后的市场冲击可能为零吗?请解释为什么。
7.一个买单之后的市场冲击预期值可能为负吗?请解释为什么。
8.什么是永久性市场冲击?它和临时性市场冲击有什么区别?
9.限价订单带来的市场冲击是什么?