Local EPUB Text
高频数据的时间间隔不规则
大多数现代计算技术经过发展,已可以用于处理每月、每周、每天、每小时或其他规则间隔数据。研究人员对固定时间间隔的传统依赖是由于:
·每日数据相对容易获得(自20世纪20年代以来报纸已经公开发布每日报价)。
·处理规则间隔的数据相对容易。
·“无论是什么推动的证券价格和收益,在短期内都没有发生显著变化的可能”这类过时观点的影响(Goodhart and O’ara,1997,pp.80-81)。
相比之下,高频观测值被变化的时间间隔分离开来。应对数据不规则的一种方法是对其进行定时抽样——如每小时或每分钟进行一次抽样。例如,如果数据要从分笔数据转换为分钟“线”(bar),则在传统方法下,任何给定分钟的卖价或买价将被确定为在该特定分钟期间到达的最后报价。如果在某一分钟内没有报价,则前一分钟的收盘价将被作为当前分钟的收盘价等。图4-6a说明了这个想法。这种方法隐含地假设在没有新报价的情况下,价格保持不变。事实却不一定是这样的。
Dacorogna等人(2001)提出了一种更精确的抽样方法:相邻报价之间的线性时间权重插值(inear time-weighted interpoation)。插值技术的核心是,假设在任何既定时间,未观测到的报价位于与它相邻的两个观测到的报价链连接而成的直线上。图4-6b显示了线性插值抽样的方法。
图4-6 数据抽样方法
如图4-6所示,两种报价抽样方法产生完全不同的结果。
在数学上,两种抽样方法可以表示如下:
抽取收盘价时的报价:
抽取线性插值法的报价:
式中,是抽样报价的结果;t是期望的抽样时间(例如,新一分钟的开始);tast是在抽样时间t之前的最后观测到报价的时间戳;qt,ast是在抽样时间t之前最后一笔报价;tnext是在抽样时间t之后的第一笔观测到报价的时间戳;qt,next是在抽样时间t之后第一笔报价的值。
图4-7和图4-8比较了作为收盘价格抽样并且插值的中间报价的直方图,频率为200毫秒和15秒。图4-9比较了收盘价和插值分布的分位数图。如图4-7和图4-8所示,抽样的分布是稀疏的,即比在频率较低时的分布抽样包含更多的零收益。同时,如图4-9所示,从插值报价计算的收益比收盘价更连续。
图4-7 “收盘价”的中间报价,以200毫秒间隔抽样(上)和15秒间隔抽样(下)
图4-8 “时间插值”的中间报价,以200毫秒间隔抽样(上)以15秒钟间隔抽样(下)
图4-9 分位数图:收盘价与插值的中间报价,以200毫秒为间隔抽样
比起将报价间隔操作为方便的规则间隔格式,一些研究人员研究了后续报价到达报价本身的时间间隔是否携带一定信息。例如,大多数研究者同意,对于禁止卖空的证券而言,交易的时间间隔确实会携带信息;交易时间间隔越短,越有可能发生了利好消息,接下来的价格变动就越大。
久期模型(duration mode)用于估计影响任何两个连续分笔数据之间时间的因素,这样的模型分别被称为报价过程(quote processes)和交易过程(trade processes)。久期模型也用于测量预定幅度价格变化之间的时间间隔和事先指定的交易量增长之间的时间间隔。处理固定价格运行的模型被称为价格过程(price processes);估计固定交易量增量久期变化的模型被称为交易量过程(voume processes)。
久期通常使用泊松过程(Poisson processes)建模,这些过程假定顺序事件(如报价到达),彼此独立地发生。假设任意两个时间点t和(t+t)之间的到达个数具有泊松分布。在泊松过程中,每单位时间到达个数为λ。换句话说,到达以平均到达率(1/λ)发生。平均到达率可以假定保持恒定,或者假设可以随时间变化。如果平均到达率是恒定的,则在时间t和(t+t)之间恰好观测到k个到达的概率是:
Diamond和Verrecchia(1987)和Easey和O’Hara(1992)首先提出,序列数据到达之间的久期会携带信息。他们的模型假设在存在卖空限制的情况下,交易间久期可以表明存在好消息;在不允许卖空的证券市场中,久期时间越短,尚未工作所知的利好消息的可能性越高。反之亦然:在有限卖空和流动性正常的市场中,后续交易到达之间的久期越长,未观察到的坏消息的概率越高。但是,完全没有交易,则表明没有消息。
Easey和O’Hara(1992)进一步指出,由时间间隔分开的交易与彼此之间相连的交易所包含的信息内容是大不相同的。Easey和O’Hara(1992)结论的另一个隐含意思是,整个的价格序列都传递信息,应该在可能的情况下加以充分利用,这也成了支持高频交易的又一个论据。
表4-3显示了2009年5月13日SPY的所有交易而得的久期的描述性统计。如表4-3所示,在常规市场时间之外,交易间平均久期最长;在收盘前一个小时,(美国东部时间下午3:00~4:00),平均久期最短。
表4-3 2009年5月13日观测到的SPY每小时交易间久期分布
相邻交易间久期的变化可能是多种原因导致的。缺乏交易可能是因为缺乏新的信息,交易不活跃则可能是因为流动性水平低、交易所暂停交易或交易商的策略考量。Foucaat、Kadaa和Kaade(2005)认为,耐心地使用限价订单提供流动性可能本身就是一个有利可图的交易策略,因为流动性提供者应当因为其等待而获得补偿。补偿常常以买卖价差的方式进行,并且是限价订单被流动性消耗着“命中”所需等待时间的函数;交易间久期越短,其引致的买卖价差也就越小。然而,Dufour和Enge(2000)以及Saar和Hasbrouck(2002)发现,交易商观察到短的久期时,买卖价差实际上更高,这与基于时间的限价订单补偿假设相悖。
除了研究相邻交易和报价的久期之外,研究人员一直在建模,发展了用于描述固定证券价格变化和交易量变化的久期模型。前后价格变化达到特定幅度所需的时间间隔称为价格久期(price duration)。随着波动率的上升,价格久期会下降。同样,前后交易量变化达到预先设定规模所需的时间间隔称为交易量久期(voume duration),交易量久期会随着流动性的增加而减小。
利用交易量久期方法的变体,Easey、Lopez de Prado和O’Hara(2011)提出了基于交易量的高频数据抽样。在基于交易量的方法中,研究人员将一计时单位定义为交易量的一次“桶”,例如50个期货合约。当“桶”被装满时,交易量计时器便开始计时了。因此,当50合约交易量计时单位在50份合约交易相继到达时便开始计时了。当100份合约交易执行时,50份合约的成交量便计时了两次。
然而,报价、交易、价格和交易量久期所包含的信息会造成估算过程的偏差。如果可用信息决定了后续交易之间的时间,则时间本身不再是一个独立变量,这会造成估算过程的大量内生性偏差。因此,与价格序列的真实方差相比,传统的交易价格方差估计值过高。