bangst

学习进度

阅读时长

未满 1 分钟

最近阅读：未开始阅读

核心概念

待提炼

章节学习

1
译者序
如果说量化投资是投资领域的王冠，那么高频交易就是这顶王冠上的明珠。国外的顶尖量化大师，如西蒙斯、德邵等，均有优秀的高频交易策略，在市场上赚取了大量稳定的收益。高频交易最大的特点就是收益非常高，而风险却非常小，当然作为代价，资金容量不会太大，所以这种策略一般都不会对外募资扩大规模。对于高频交易的策略，宽客们也往往不愿意分享，所以当《高频交易》这本书的第一版出来
待学习
开始阅读
2
媒体、现代市场和高频交易
虽然市场整体的改变搅乱了经纪商的自营端业务，并将很多经纪商挤出了业务市场，但这些改变对于整个社会来说，绝大多数属于积极的影响，而节约下来的成本直接进入了投资者的口袋。在过去，经纪人光靠打电话下订单，在他们的电脑屏幕上观察市场，就能够获得数以百万美元的高额奖金，现在这种好日子已经一去不返了。资金重新流向了银行股东和终端投资者（end investor）。显而
待学习
开始阅读
3
高频交易由交易方法论演化而来
那些倾向于依靠技术分析决定何时进入或离开某个头寸的经纪商，对高频交易的反对声最高。技术分析是最早的交易技术之一，受到很多交易商的青睐，从很多方面来看，技术分析是今天复杂计量经济学和其他高频交易技术的先行者。技术分析师最早兴起于1910年早期，他们力图识别证券价格重复出现的模式。技术分析中所使用的很多技术，是测量当前价格水平和移动平均价格的相关性，或者移动平
待学习
开始阅读
4
什么是高频交易
高频交易是一个总括性的术语，由几类策略组成。高频交易的范围较广，不同的市场参与者对高频交易持有不同的观点。本节讨论常见的高频交易定义。高频交易是指包括所有利用快速算法执行的活动例如，美国商品期货交易委员会（CFTC）的技术小组委员会，负责确定工作高频交易的定义，2012年6月使用了以下草案来定义。高频交易采用自动化交易： ·决策制定、委托订单启动、产生
待学习
开始阅读
5
高频交易员做什么
尽管对高频交易的确切定义有分歧，但大多数市场参与者认为高频交易策略分为以下四大类别： 1.套利； 2.基于事件的方向性交易； 3.自动化做市； 4.流动性检测。套利策略能够消除价格偏离长期均衡或相对资产的错误定价，包括多个资产类别以及多个外汇品种。很多高频套利策略能在多个证券间探测到价格差异，本书第8章会对此进行讨论。同一个资产在不同交易所之间的价差套利，
待学习
开始阅读
6
有多少高频交易商
高频交易商的数量，很大程度上取决于高频交易的概念。如前文提到的，在美国商品期货交易委员会2012年6月制定的草案中所使用的高频交易定义，19/20或95%的投资者和交易商可以被称为高频交易商。Kirienko、Kye、Samadi和Tuzun（2011）认为，高频交易商在低库存的同时产生巨大的交易量，那么高频交易占电子迷你标准普尔500指数（S&P 500E
待学习
开始阅读
7
高频交易主要参与者的空间
许多高频交易的参与者喜欢在产生很大利润的同时，避开众人的瞩目。最知名的高频交易机构包括全球电子交易公司（Getco）、文艺复兴资本科技有限公司和德·肖基金（DE shaw）。致力于高频交易的参与者也包括专业公司，鲜为人知但获利颇丰的有IV资本（IV Capita）、DKR聚变（DKR Fusion）和世界宽客（WordQuant）。然而，高频交易与其他形式的
待学习
开始阅读
8
本书结构
撰写本书的目的在于，为有兴趣着手或想提升高频交易操作的管理者和雇员们，提供最新的已经应用和将要实施的高频交易知识。同时，也包括想避开高频交易并保护他们自身及其客户交易活动的个人和机构，以及想要更好地理解现代金融市场的业余观察者。本书第2～5章，解释了当代前沿金融市场。第2章描述了算法交易和高频交易的技术革命；第3~5章，通过描述现代市场微观结构、高频数据和
待学习
开始阅读
9
硬件简史
英语bench[1]或意大利语banca是今天银行（bank）的直接前身，当货币第一次在指定地点兑换时，贸易就在罗马帝国时期制度化了。潜移默化地改变和引导着贸易公司的运作，直到20世纪，技术革命使信息交换快速化，从而改变了那时的交易状态。如图2-1所示，在过去100多年，交易商使用计算机使得计算速度呈指数增长，而计算的成本自20世纪80年代以来一直下降，达到
待学习
开始阅读
10
信息
图2-6 交易中通信协议三个级别的复杂度然而，报价过程的完整性在交易模型开发中很重要。交易算法开发者可以依靠报价流的特性来生成即将到来的市场动态预测信号。如果模型开发中使用的历史报价流的结构，与交易商在“开市”环境中遇到的报价流的结构明显不同，则计算的预测可能停止工作。应注意确保在算法的模拟和回测中使用的数据在结构上与实际开市环境中接收的数据兼容。至少，算
待学习
开始阅读
11
软件
图2-12 算法的常见元素图2-12中所示的算法元素将在整本书中用于解释常见高频交易策略的算法设计。图2-13说明了以下简单的做市算法的分步过程。 1.开始程序。 2.检测市场情况：市场条件是否适合做市。 3.如果是，开始做市。 4.如果否，等待一分钟。 5.重复步骤2。图2-13中呈现的算法是“嵌套的”，或者包括图2-13中标为“检测市场情况”和“开始
待学习
开始阅读
12
市场类型
在金融市场中，投资者和其他市场参与者在买卖证券时，都有这样一个想法，所有的交易都会被妥善地处理和解决。但在这个方面，金融市场其实不同于其他非金融市场，比如隔壁的杂货店。当一个顾客进入杂货店，他希望能快速执行他的交易，用他的钱去换商品——食物。杂货店的收银机能够完成这项结算功能：收据逐条列出了顾客购买的产品和杂货店收到金额的总数，现在通常通过顾客的账户收取，而
待学习
开始阅读
13
限价订单簿
在任何给定的时间，在一个特定的交易地点，可以满足新到达市价订单的限价订单累计交易规模，被称为流动性。交易所限价订单交易商的数量越多，每个交易商的限价订单规模越大，该交易所的流动性就越强。流动性在今天的市场也必然有限：限价订单的数量是可以测量的，每个限价订单也都有一个有限的规模。流动性首先由Demsetz（1968）定义。为了处理限价订单，绝大多数的现代交易
待学习
开始阅读
14
激进执行与被动执行
订单可以被描述为被动的或激进的。激进订单不意味着恶意订单，被动订单也不表示注定是被利用的订单。相反，订单的激进性或被动性是指订单价格与当前市场价格的接近程度。图3-5说明了这个概念。图3-5 激进和被动订单远离市场价格的限价订单（低价限价买单或高价限价卖单）被认为是被动的。限价订单越接近市场价格，订单越激进。市价订单是最激进的订单，“交叉价差”（cros
待学习
开始阅读
15
复杂订单
为了应对新进入者在撮合业务中的竞争，交易场所已经使其订单产品多样化。例如，为了回应来自暗池的竞争，一些精选的交易所扩展了可用订单的数量，创建了所谓的冰山订单（iceberg orders）。冰山订单允许限价订单交易商在限价订单簿中只显示其订单的一部分，并将其余流动性保留在黑暗中。在FIFO限价订单簿中，冰山订单在时间优先级的基础上执行：当与较小的订单撮合时，
待学习
开始阅读
16
交易时间
传统上，许多交易场所从东部时间上午9：30到下午4：00运行。在当今的全球化市场中，更多的努力用于扩大交易的无障碍环境。因此，今天的许多交易所提供盘前交易和盘后交易，都称为延长时段交易。例如，延长的股票时段允许从东部时间上午4：00到下午8：00进入市场。延长时段的交易量，比在正常交易时段观测到的小得多。然而，所选择的经纪人使用盘后交易，以满足客户的收盘市价
待学习
开始阅读
17
现代微观结构：市场趋同和分歧
市场的电子化已经在所有现代市场上留下了不可磨灭的足迹，使得交易的某些方面流水线化，并分化了其他方面。在市场趋同趋势中有以下发展： ·如今大多数市场可以通过金融交换协议（FIX）访问。FIX协议是类似XML的规范，在快速有效的交易所需的信息中，允许市场参与者发送和接收报价、订单，以及订单撤销和执行确认。FIX协议由独立的非营利机构管理，并进一步促进协议的推广。
待学习
开始阅读
18
股票的分化
美国股票可在暗池或公开交易所交易。暗池是类似交易所的实体，其订单簿是“黑暗的”——不向该池的任何参与者显示情况。根据量化技术提供商Pragma Securities（2011）所说，美国约22%的总股本目前在暗池中交易。暗池的独特优势在于它们有撮合大订单而不披露与订单大小相关联信息的能力，而且订单不被观察。暗池的常见缺点包括缺乏透明度及其相关问题。与“公开”
待学习
开始阅读
19
期货的分化
期货交易所的操作方式类似于股票交易所，但在本书编写时还没有实行或未来可能实行回扣定价。为了吸引流动性，与股票中流行的回扣结构不同，期货交易所一直在部署比例撮合，这在前面已经讨论过。期货交易所的其他差异主要基于其操作和风险管理决策，例如何时实施熔断机制等，在第13章中会有详细描述。
待学习
开始阅读
20
期权的分化
过去10年间，各种期权交易所纷纷涌现。然而，大多数交易所都在类似的原则上运行，并由同一群做市商驱动。由于绝对数量的期权具有不同的到期日和执行价格组合，大多数期权几乎没有交易。相同的10个左右经纪自营商，倾向于用大的价差，在大多数股票期权市场提供流动性。期权交易中相对缺乏活跃度，使得能够对内幕信息进行市场监控。一笔大的远期期权交易，或远离当前市场价格的期权
待学习
开始阅读
21
外汇的分化
在外汇交易中，为了能直接访问终端交易商，交易商间经纪人开始与经纪人开展竞争。例如，传统的交易商间经纪人Currenex和iCAP，现在接受选定的机构客户。在代理其他交易所时，iCAP在其所有的顶尖外汇交易所（外汇）报价上提供250微秒的有效性。
待学习
开始阅读
22
固定收益的分化
虽然大多数固定收益传统上为场外交易，但一些迹象表明固定收益市场有潜在的短期交易所化。因此，iCAP计划使用纳斯达克OMX技术推出固定收益撮合引擎。iCAP的产品将通过提供所有顶级报价的一秒有效期，进一步瞄准机构投资者。
待学习
开始阅读
23
掉期的分化
掉期也通过与私下谈判的合约，允许传统上的场外交易。根据《多德-弗兰克法案》，掉期需要在交易所进行标准化和电子交易。一类统称为掉期执行设施（SEF）的新型交易场所，在本书编写时正由行业和监管机构联合建立中。总结现代市场是一个复杂的商业场所，关注流线化运营，其目标是向客户提供最直接、成本效益最高的服务。交易场所的竞争导致了交易所和可供选择的交易系统的方法、定
待学习
开始阅读
24
什么是高频数据
高频数据，也被称为分笔数据（tick data），是实时市场活动的记录。每次客户、经销商或其他实体发布所谓的限价订单，以q的价格，用有特殊安全代码股票报价器（ticker）购买s件X，买盘报价被记录为在tb时，购买件X。分笔数据记录以一种不同的方式将市场买卖盘合并在内，这一点在本章也有详细的讨论。当新到达的买盘报价比前面所有的有效买盘报价都相对要高时，则被
待学习
开始阅读
25
高频数据如何被记录
最高频率的数据是连续的“分笔数据”，即最新到达报价、交易、价格、买卖盘大小和成交量信息的集合。分笔数据通常具有以下属性： ·时间戳（timestamp）； ·金融证券识别码； ·表明它具有哪些信息的一个指示器： ·买价（bid price） ·卖价（ask price） ·申买量（avaiabe bid size） ·申卖量（avaiabe ask size
待学习
开始阅读
26
高频数据的属性
关于高频证券数据的研究已经有很多年了。但是对于学者和从业人员来说，还是非常新奇的事物。不同于金融研究和相关应用中常使用的每日或每月的数据集，高频数据有着独特的性质，对于研究者来说同时存在优点和不足。表4-1总结了高频数据的性质。每个性质及其优点和缺点都会在接下来的内容里进行详细讨论。表4-1 高频数据属性总结
待学习
开始阅读
27
高频数据是巨量的
表4-1所展示的SPY的约两分钟分笔数据样本包含2000个Leve I数据的观测量：最优买价和交易量、最优卖价和交易量，最新成交价和成交量。表4-2总结了由纽约证交所高增长板块所提供的SPY数据点的细目，时间为2009年11月9日，14：00：16：400～14：02：00：000GMT，以及2009年11月9日SPY，日元期货和欧元看涨期权的相关信息。表4
待学习
开始阅读
28
高频数据受交易波动的影响
除了在低频数据中长期可以获得的交易价和交易量数据外，高频数据包括买入和卖出报价及其相关的订单大小。买入报价和卖出报价数据到达不同步，且在报价过程中会有干扰信息。任何给定时间的买入报价和卖出报价之间的差被称为买卖价差（bid-ask spread）。买卖价差是即时买入和卖出证券的成本。买卖差价越大，证券须产生的收益越高，以便与其他交易成本一起弥补差价。大多数
待学习
开始阅读
29
高频数据不是呈正态或对数正态的
许多古典模型假定价格呈对数正态分布，承认价格分布之间没有空隙，并产生了几种定价模型，如Back-Schoes模型，这些模型被视为与相关金融工具市场的真实价格情况近似。实现价格对数正态的必要条件之一是连续价格变化的正态分布。然而，本节显示大多数分笔数据，如中间报价、大小加权报价和交易的连续性改变并不遵循正态分布，但连续交易分笔数据的分布接近正态。因此，交易分笔
待学习
开始阅读
30
高频数据的时间间隔不规则
大多数现代计算技术经过发展，已可以用于处理每月、每周、每天、每小时或其他规则间隔数据。研究人员对固定时间间隔的传统依赖是由于： ·每日数据相对容易获得（自20世纪20年代以来报纸已经公开发布每日报价）。 ·处理规则间隔的数据相对容易。 ·“无论是什么推动的证券价格和收益，在短期内都没有发生显著变化的可能”这类过时观点的影响（Goodhart and O’ar
待学习
开始阅读
31
大多数高频数据不包含买卖标识符
无论是Leve I或Leve II报价数据都不包含说明给定记录的交易是市价买单还是市价卖单的标识符，而一些应用要求买卖交易标识符作为模型的输入量。为了克服这个困难，在这里提出了四种方法来估计一个交易是根据Leve I数据的买入还是卖出： ·限价卖空规则（tick rue）；[1] ·报价规则（quote rue）； ·Lee-Ready规则（Lee-Read
待学习
开始阅读
32
执行成本概要
根据经典的金融学，市场是没有漏洞的（seamess），意即市场具有如下的特性： ·市场具有同质的结构。 ·市场是统一的，即当某一金融工具发生一笔交易时，该金融工具的价格会实时更新。 ·价格及时反映了所有的基本面信息。 ·不存在交易成本。 ·任何规模的订单都能立即执行，即市场的流动性是无限的。限价订单簿上的每个报价都有无尽的限价挂单提供流动性。 ·交易商可以毫
待学习
开始阅读
33
透明执行成本
透明成本通常在交易之前就已确定，包括经纪商佣金、交易所费用和税收。本部分对每一个透明成本进行详细的探讨。经纪商佣金经纪商通常会对如下的服务收取佣金： ·提供连接交易所、“暗池”和其他交易场所的服务。 ·促进客户的下单在“最优价格”成交：按照客户的特殊要求执行交易订单。 ·在场外交易市场上做客户的交易对手或对手合约。 ·提供资产的保管服务。 ·清算客户从执
待学习
开始阅读
34
隐性执行成本
对于分笔级别的数据，交易成本中隐性成本的影响越来越重要，包括投资的机会成本、买卖差价、延迟成本以及市场冲击。一些研究人员和交易员还发现了一些其他的隐性成本，包括价格上涨成本以及市场择时成本。买卖价差买卖价差是事先并不知道。它们呈现出任意性或随机性的变量，只有利用它们历史数值的分布才能描述其最佳特征。买卖价差是任意一个时点上，最优买价和最优卖价之间的差值
待学习
开始阅读
35
背景和定义
所有的交易和订单背后都在传递着信息。好比一个交易员把他的资金或者声誉押宝在市场的某一个方向上，并且告诉其他的市场参与者他的看法。观察一名交易员的行为所获得的信息远比一名分析师的看法更有说服力。分析师拿的是固定工资，收入和他们的预测实现与否无关。与此同时，交易员所依赖的是从他们的交易获利中按比例抽成，每一笔交易的成功对交易员的福利有着直接的影响。因此，交易被
待学习
开始阅读
36
市场冲击的估计
关于市场冲击的度量，好比回答这样的问题：“如果交易员交易成功，他会把价格推到什么位置？”图5-5展示了对于单一订单的到达，市场冲击是如何确定的。冲击始于t*时刻，即订单到达交易所时，例如，度量市场冲击可以通过观察t*时刻之后相对于上一笔交易时，即t*时刻前的价格的变化量，如图5-5所示。成交后的交易参考时间t可以分别以时钟时间、达成指定交易笔数的时间、达成指
待学习
开始阅读
37
永久性市场冲击的实证估计
数据准备市场冲击可以使用Leve I和Leve II的逐笔交易数据或者是含有交易时间戳的数据来估计。Leve II的数据可以精确定位限价订单与市价订单：特定价位上竞买数量增加意味着限价订单的到达；最高竞买价的流动性减少意味着市价卖单的到达。当使用Leve I数据时，在区分是由买家还是卖家下单上会遇到困难。近年来，研究人员开发了一些方法来区分买卖订单：包括
待学习
开始阅读
38
衡量绩效的原则
只有能够衡量的事物才能被很好地管理。因此，如何衡量高频交易策略的绩效对投资管理和高频交易来说十分重要。当一些为标准化的投资管理而提出的指标被广泛地用于高频交易设定时，还有很多其他指标特定用于高频交易活动的衡量。成功的高频交易投资管理需要具备三个核心要素（3P）： ·准确性（precision）； ·生产力（productivity）； ·绩效（perfor
待学习
开始阅读
39
基本的绩效衡量指标
投资收益交易策略可以有多种形式和规模，最能够比较不同交易策略可行性的指标就是投资收益。投资收益也称投资回报，可表现为以美元为计价单位的价格差异，但更多的是被视为价值上的百分比变化。它所产生的无量纲的（dimensioness）指标独立于金融工具的价格水平，能够很容易地比较不同策略和不同资产的表现：简单收益方程式（6-1）如图6-1所示。图6-1 简单收
待学习
开始阅读
40
有可比性的比率
虽然平均收益、标准差和最大回撤描绘了一个交易策略的绩效，但它们并不能帮助比较两个或以上的交易策略。因此，人们发明了不少以单个数字呈现的用来比较不同交易策略的均值、方差、尾部风险的比较参数。表6-1总结了最常用的几个估计参数。表6-1 绩效度量总结第一代的点绩效衡量标准是从20世纪60年代开始发展的，包括夏普比率、詹森阿尔法和特雷诺比率。夏普比率可能是最常
待学习
开始阅读
41
绩效归因
式中，xjt是第j个金融证券在投资组合中的相对权重，。因此，第j个金融证券有一个可以用K个系统因子来解释的t周期的收益：式中，Fkt是t时段内的其中一个K系统因子（k=1，…，k），λ是因子负荷，ejt是t时段内证券j的非系统性风险收益。根据Sharpe（1992）的研究，这些因子可以当成广泛的资产类别、个股或其他证券。结合式（6-17）和式（6-18），
待学习
开始阅读
42
Alpha衰减
总结评估交易策略的统计工具使管理者能够评估高频策略对其投资组合的可行性和适当性。随着交易员和投资经理对高频交易策略理解的加深，新的指标也被提出来用于捕捉高频交易策略的变化。作为策略可行性的快速测试，夏普比率仍然是最受欢迎的。章末问题 1.什么是夏普比率？它的缺点是什么？如何完善和提高？ 2.什么是索提诺比率？ 3.假设对给定的高频交易策略的绩效归因分析发
待学习
开始阅读
43
高频交易的关键过程
高频交易的核心价值主张是通过分笔数据处理和高资金周转率来实现的。识别报价流中细微变化的技术是这个业务的不同之处，并且使交易商能够向建仓和平仓位置发送急速信号。只有通过自动交易才能处理多个金融工具上的每个分笔数据。评估以微秒分隔的数据、解释大量的市场信息、以一致和连续的方式做出交易决策，对于人类大脑来说是太复杂的任务。但是，一个便宜的全自动高频交易系统就可以
待学习
开始阅读
44
适合高频交易的金融市场
有许多证券和市场条件都符合进行高频交易的情况。然而，某些证券市场尤其合适。符合这种类型的交易必须满足两个要求：有快速建仓和平仓的能力；有足够的市场波动性以确保价格变化超过交易成本。不同市场的波动性显示出高度相关性，并且取决于大量进入市场的宏观经济新闻的数量。快速建仓和平仓的能力又由两个因素决定：市场流动性和电子化执行的可行性。流动性资产的特点是充足的现成
待学习
开始阅读
45
高频交易的经济学
进行高频交易业务的成本高频交易业务的成本驱动因素是数据、劳动力、设备和软件、交易成本、行政和法律成本，最重要的是交易损失。有效的风险管理、监控和合规框架（会在第14、16章讨论）可以限制交易损失。本节描述了不归因于风险的经营成本。数据成本数据往往是非常昂贵的或完全免费的。多家公司，如路透社和彭博，供销售的分笔数据具有极高的溢价。经纪商和交易场所可以向潜
待学习
开始阅读
46
市场参与者
竞争对手高频交易公司与其他更传统的投资管理公司以及做市的经纪商竞争。与传统的共同基金和对冲基金的竞争集中在吸引投资。量化对冲基金和其他高频交易公司的竞争还包括招聘有才能和有经验的策略专家和技术专家，以及对于市场无效性的直接竞争。同样，与传统的非高频交易经纪经销商的地盘之争，涉及成为获得在传统做市场所的盈利机会的“第一优先权”。投资者高频交易的投资者包括
待学习
开始阅读
47
统计套利的实际应用
一般的讨论在统计套利模型中，交易的两个或多个金融工具的价格一般而言是基本面相关的，可以跨越各种资产类别和名称。在股票市场，发行股票的公司可能属于同一行业，因此对市场的变化所做出的反应会非常接近。也有一种可能，这些股票是由同一家公司发行的。一家公司通常会发行多种类型的股票，这些不同类型的股票分别享有不同的股东投票权利。即使是同一家公司发行的同一类证券，也会由
待学习
开始阅读
48
开发基于事件的方向性策略
基于事件的方向性策略（directiona event-based strategies）指的是，一类利用市场对事件的反应进行交易的策略。这些事件可以是经济事件，也可以是行业相关事件，这些事件会重复地对所感兴趣的证券产生影响。例如，美国联邦基金利率的意外上涨会使美元持续升值，与此同时提高美元/加元的汇率，并降低澳元/美元的汇率。因此，美国联邦基金决议的宣布是
待学习
开始阅读
49
什么构成了一个事件
事件套利策略中的时间可以是任何的经济活动新闻公布、市场干扰，或者其他影响市场价格的时间。事件的重复发生使得研究者能够估计事件的历史影响，并且将这种影响投射到未来。不同事件的量级（magnitude）不同。有些事件可能会对价格有正向或负向的影响，还有一些事件可能会产生相比其他事件更为严重的后果。一个事件的量级可以用实际发生事件的数据对预期值的偏离大小来衡量。
待学习
开始阅读
50
预测方法
预测的开发涉及非常详细的围绕关键性事件公告的交易数据的研究。对事件的研究考量了围绕公告对新闻事件相关的收益的定量化影响，一般有如下执行步骤。 1.确认并记录公告的日期、时间和事件的“超预期”的变动。为了创建出有效的模拟测试，事件和事件前后交易的证券价格的数据库必须非常详细，必须仔细将事件分类，报价和成交的数据必须在高频基础上进行抓取。未预期的部分成可以用以下
待学习
开始阅读
51
可用于交易的新闻
这一节总结了不同的事件类型和它们对特定金融工具的影响。这些事件的影响可以从各种学术资源中得出。因为这些研究第一次是由于机器可读新闻的大量产生和对这一系列交易策略的广泛兴趣才发表的，这些新闻影响的时间框架可能已经大大缩短。然而，描述的影响是基于很强的基本面因素，并且这种影响很容易持续，即使对更短的时间段来说也是如此。一些纳入研究的低频数据估计了这种影响，而研究
待学习
开始阅读
52
事件套利的应用
事件交易可以应用于许多资产类别，然而每一事件对每种金融工具的影响却有可能是不同的。这一小节研究了事件对不同金融工具的持续影响。外汇市场 Ameida、Goodhart和Payne（1997）；Edison（1996）；Anderson、Boersev、Diebod和Vega（2003）；Love和Payne（2008），还有许多其他学者，都研究过外汇市场对
待学习
开始阅读
53
引言
每个有经验的交易商都能详述一个居于主导位置的人工做市商所“持有”的某种特定金融工具交易的故事，这些金融市场的主要人物为他们的雇主创造了巨额的基于交易的利润，从而获得丰厚奖金并过着奢侈的生活。除了少数情况，几乎所有讲述这些红极一时交易员的故事都是以相同的刺耳注解告终：“于是有一天，市场开始背离他，他遭受了巨大损失并且在第二天被解雇。”这种“精疲力竭”的一个例
待学习
开始阅读
54
做市：关键原理
简要地说，“做市”描述的是对市场买卖双方限价订单价格的布局。一个做市商将一个限价买单配制在略低于市场价格的位置，而将一个限价卖单配制在略高于市场价格的位置来创造或“制造”“市场”。当另一个市场参与者报出一个买单，并且和做市商限价卖单相匹配，那么限价卖单就被执行（也就是说，一个空头头寸被记录在做市商的账户里）。相似地，如果另一个市场参与者报出一个卖单并与做市商
待学习
开始阅读
55
模拟做市策略
限价订单的交易会产生非线性报酬；限价订单有时会被执行，有时不会被执行，这导致了限价订单建模的困难。这一部分研究了限价订单的建模逻辑。假定在模拟订单被配置的同时，每个订单在最新的成交价格附近被执行，配置市价订单的策略可以通过可观测到的数据被模拟出来。与此相比，限价订单执行模拟的要求不止于此。大多数可靠的模拟认为，仅当最优反向报价达到或超越限价订单时一个给定的
待学习
开始阅读
56
朴素做市策略
在这一部分阐述了仅与有效存货管理有关的做市策略实际应用的细节。基于短期市场方向性预测的优化处理在第11章进行讨论。固定偏离最朴素的做市策略是根据事先决定的偏离市场价格的标记数在市场双向持续配置限价订单。自然而然，限价订单被执行的可能性依赖于限价订单的价格与现在市场价格的接近程度。限价订单配置在当前市场报价的位置很有可能被执行，而对于那些远离市场价格的被动
待学习
开始阅读
57
做市作为一种服务
50多年前做市的关键目标就被正式定义为对证券交易的需求和“可预测的即时性”的供给（见Demsetz，1968）。其中，可预测的即时性即包含了流动性。直观地讲，每当流动性水平较低时，增加流动性的服务尤其有用，并且与此相联系的奖金和策略的获利能力格外高。反过来，每当流动性水平格外高时，激进的流动性-消费型订单会释放较高的收益。多年以来已经产生了许多对流动性的
待学习
开始阅读
58
有利可图的做市商
为了确保做市商交易是有利可图的，要把握住几个关键的条件。这几个关键的条件，追溯至加曼（1976），涉及了限价订单的到达率、盈利和损失的概率，以及交易工具的价格。在买单和卖单之间暂时的不平衡，可归因于个人交易商和一个优化自己订单流的交易商之间的不同，这些潜在的不同可能会反映在预算、风险偏好、市场准入以及众多其他特质上。个人交易商对他们自己问题的优化，相比于这
待学习
开始阅读
59
数据里隐含的内容
可公开获取的数据所包含的信息足以用来对短期价格的变动进行诊断，并且据此管理自己的头寸。这一部分提供了四个案例来进行说明。案例和图表展示了所有市场参与者从一个给定的交易场所订阅的Leve I数据可观察到的样本市场情形。案例可应用于所有的为配对交易配置了集中限价订单簿的交易场所。在所有的图中，横轴代表的是时间。实线代表在某一指定的观察时点最高买价和最低卖价，即
待学习
开始阅读
60
订单流里的建模信息
本章余下的部分描绘了四种成熟的技术，这些技术被用来根据其他市场参与者的行为，来判断即将的市场走势。本章所阐述的模型将下列因素列入考虑： ·订单流的自相关； ·订单（指令）流的激进程度； ·订单簿的形态； ·报价的时序演化。作为市场走向预测器的订单流的自相关订单流是作为终端客户接受信息并基于信息做出行为的结果。对各种不同类型的市场参与者而言，信息模型被用来
待学习
开始阅读
61
潜伏套利
金融理论的一个重要概念是一价定律。这个定律指出，在良好运行的市场，给定的某一金融工具总是有统一的价格，无论金融工具所交易的市场特性是什么。一价定律同时确保，无论低频交易商决定在哪个市场进行交易，他们始终会在公正的市场价格上进行交易。换句话说，在理想的理论市场条件下，伦敦的IBM股票价格应该总是和调整汇率后的纽约的IBM股票价格一样。无论因为什么原因，同一金
待学习
开始阅读
62
价差剥头皮
总而言之，于某些市场参与者而言，价差剥头皮可能看起来像一个掠食策略，虽然从它最朴素的形态中极难获利。价差剥头皮佐以持仓存货与信息化考量，就是大多数市场参与者称为的做市，这是一种合法的行为，是市场功能的重要组成部分。失去了价差两边的限价订单，需要立即成交的交易商的市价订单就无法被执行。相对于为了每天在市场两边提供限价订单而付出的工作量，价差补偿只是一份微不足道
待学习
开始阅读
63
回扣获取
另一个经常提出作为高频交易危险性的例子就是回扣（rebate）获取。在这种策略下，高频交易商被认为简单地通过在不同交易所间对限价订单和市价订单的成本进行套利，就能产生收益。该策略被认为是没有经济价值的空转，也是市场分化错误的一个常见例子。在现实中，如本节所示，回扣有助于提高交易策略的盈利能力，但无法在像第8～11章提到的预测方法的情况下提供盈利。为了盈利，
待学习
开始阅读
64
分层挂单
·经纪商可以使用优先权执行一部分订单，为客户确保一个优惠的价格。 ·如果客户的订单没有下达，经纪商可以直接撤销占位符挂单。同样地，做市商可以决定执行或撤销订单，这取决于他对库存和信息风险的估计。因此，实际上大多数分层挂单策略并不具有操纵性，但确实因为撤单堵塞了网络和撮合引擎，并在市场中产生了不必要的噪声。芝加哥商品交易所（CME）实现了一个成功的解决方案
待学习
开始阅读
65
试盘/狙击/嗅探
试盘、狙击、嗅探和钓鱼这些绰号，通常指的是同一种策略类型。试盘策略就像点火策略，找出限价订单的隐藏池并与之反向撮合，创建和驱动临时的市场冲击以获取小利。就像点火策略一样，这样的策略经常在暗池中出现。有些暗池，比如花旗银行的自动交易柜台，已经设计出能够检测试盘者并且向试盘行为收费的方法。这样的费用让试盘无法获利，用市场机制阻碍了试盘者。试盘虽然在暗池中是可行
待学习
开始阅读
66
幌骗
总之，大多数被认为是非法的高频交易行为和高频交易商应该被禁止的原因并不存在，或者是已经非法行为的直接结果，比如说市场操纵。在下面章节中我们将讨论市场操纵行为的识别和有利于市场操纵的市场条件。
待学习
开始阅读
67
拉高出货
图12-1 排除高频交易拉高出货操纵的市场冲击为了检验市场冲击随时间的演变，我们考虑不同时间窗口下的市场冲击，窗口的长度取决于市价订单在事件之前和之后的一些交易，如图12-2所示。图 12-2 为了描述市场冲击函数f，我们做出以下规划：为了评估拉高出货策略的可行性，我们使用一个线性规划来描述市场交易量V的市场冲击函数，此处与下列学者的研究结果一致：Br
待学习
开始阅读
68
机器学习
例如，受监督的Boosting算法，工作原理如下：一个独立变量Y，比如在一个特定的金融工具收益率时间序列中，配有一个函数G，表示Y独立于另一个金融工具X的依赖度，以及参数θ：然后，Boosting错误类型的计算如下：式中，Ist<>0是指示函数，当G（Xt，θ）与Yt准确匹配时，Ist<>0的值就为零；当εt不等于零时，Ist<>0等于1。时间序列Wt代
待学习
开始阅读
69
全球监管机构的主要举措
目前，监管层的主要问题包括： ·管辖权； ·系统稳定性； ·投资者保护； ·高效的交易撮合； ·市场结构。本节详细讨论每一个问题。管辖权市场监管者对高频交易的监管深而广，他们的工作之一就是对市场提供合法的监督。由于个人管辖权的哲学与历史原因，市场监管机构的角色和目标在区域基础上已发生了进化。大部分美国的监管代表了以规则为基础的方法，其中监管机构为在市
待学习
开始阅读
70
度量高频交易风险
纳斯达克和美国第三大交易所电子交易运营商BATS最近的问题说明，运行不良的高频交易系统独立风险可能会在瞬间导致数百万美元的损失。因此，理解和管理嵌入高频交易的风险是保证高频交易企业经营成功的关键。后面章节详细介绍了不同风险类型的风险敞口的量化和管理。第16章记录风险监控的最佳实践。度量风险的方法取决于所考虑的风险类型。所有风险可分为以下几类： ·监管和法律
待学习
开始阅读
71
为什么选择执行算法
执行算法对所有投资者来说已是必不可少的交易方法，因为它能够通过将大订单分解为多个小订单，减少市场冲击和降低订单的可见性，来帮助交易商积累或清算交易头寸。为了避免“漏单”，在订单执行失败时，限价订单算法会取消许多订单。随后，这些订单通常又会以接近市场的价格迅速被重新提交。不同的算法可以以不同的方式大幅降低执行成本。执行成本包括交易所及经纪交易商费用、买卖差价
待学习
开始阅读
72
订单路由算法
·执行成本最小化； ·获取最优交易价格； ·最大限度地提高交易执行速度； ·交易痕迹最少化； ·交易规模最大化。算法会选择合适的交易场所和恰当的市场条件，以实现执行成本最小化。交易场所的选择可以简化收费结构，选择合适的交易执行时间可以捕获买卖价差小的时段，以及减少或消除滑点，或者消除随后的冲击成本（稍后详述）。为了获取最优的交易价格，复杂的算法会进行短期的
待学习
开始阅读
73
基础模型的问题
上一节讨论的TWAP、VWAP和POV执行模型是在20世纪90年代发展起来的，现在仍然广泛流行，但它们存在着严重的缺点： 1.只有在特定的市场条件条件下，这些模型才能被证明是最优的。 2.使用高级数学工具才能简单地建立这些模型。早期模型的优化条件在有限的市场动态假设下，如鞅定价方法（martingae pricing）、布朗运动算法（ABM）、TWAP和
待学习
开始阅读
74
高级模型
订单预定补充是指按照市场秩序重新下单的过程，图15-16显示了在限价订单中补充订单的实例。图15-16 限价订单补单过程程式化的补充函数假设订单拥有一个“影子”的形式，即当流动性用完之后，订单又得到补充的一种结构。假定影子订单的存在独立于当前价格水平——影子订单随着价格的变动而沿着价格轴上下滑动。订单中的流动性回归到订单的影子形式被称为订单弹性（resi
待学习
开始阅读
75
最优执行策略的实现
为了确定上一节提出的每一框架下的最佳订单分解方法，执行交易商可以通过以下步骤： 1.估计经验冲击成本函数。 2.选定符合交易安全性的临时性和永久性分布。 3.基于步骤1得出最优分配。 4.执行策略测试。 5.将策略应用于现实生产环境。由此产生的执行策略在选定的市场条件表现良好。总结订单执行算法与当今市场是密不可分的。它对于广大投资者来说是必不可少的，它
待学习
开始阅读
76
模型开发的生命周期
高频交易系统的性质，需要毫不犹豫地快速决策和执行。在这些“关键任务”交易中，特别是在艰险的市场条件下，经过编程的计算机系统通常胜过人力交易商，参见Adridge（2009b）。因此，计算机交易系统正在迅速取代世界各地交易所的传统人工交易商。完全自动化交易系统的开发，遵循与标准软件开发流程相似的路径。开发过程的典型生命周期如图16-1所示。图16-1 典型
待学习
开始阅读
77
系统实施
实施高频系统的关键步骤绝大多数系统交易平台的结构都如图16-2所示。本节详细讨论流程的每个组成部分。图16-2 典型的高频交易过程步骤1：核心引擎核心引擎由一个或多个运行时处理器组成，包含了交易机制的核心逻辑，并且履行以下职能： ·接收、评估和归档传入报价。 ·进行运行时计量经济分析。 ·实施运行时的投资组合管理。 ·启动和发送买卖交易信号。 ·等待
待学习
开始阅读
78
测试交易系统
推出包含程序错误或漏洞的系统的成本可能很大。因此，在模型被广泛推出来之前，对系统进行全面测试至关重要。测试包括以下几个阶段： ·数据集测试； ·单元测试； ·整合测试； ·系统测试； ·回归测试（回测）； ·自动化测试。数据集测试数据集测试是指测试数据的有效性，无论是在回测中使用的历史数据，还是从数据流提供者获得的实时数据。数据测试的目的是确保系统能够减
待学习
开始阅读

Reader

章节阅读

Local EPUB Text

高频数据的时间间隔不规则

大多数现代计算技术经过发展，已可以用于处理每月、每周、每天、每小时或其他规则间隔数据。研究人员对固定时间间隔的传统依赖是由于：

·每日数据相对容易获得（自20世纪20年代以来报纸已经公开发布每日报价）。

·处理规则间隔的数据相对容易。

·“无论是什么推动的证券价格和收益，在短期内都没有发生显著变化的可能”这类过时观点的影响（Goodhart and O’ara，1997，pp.80-81）。

相比之下，高频观测值被变化的时间间隔分离开来。应对数据不规则的一种方法是对其进行定时抽样——如每小时或每分钟进行一次抽样。例如，如果数据要从分笔数据转换为分钟“线”（bar），则在传统方法下，任何给定分钟的卖价或买价将被确定为在该特定分钟期间到达的最后报价。如果在某一分钟内没有报价，则前一分钟的收盘价将被作为当前分钟的收盘价等。图4-6a说明了这个想法。这种方法隐含地假设在没有新报价的情况下，价格保持不变。事实却不一定是这样的。

Dacorogna等人（2001）提出了一种更精确的抽样方法：相邻报价之间的线性时间权重插值（inear time-weighted interpoation）。插值技术的核心是，假设在任何既定时间，未观测到的报价位于与它相邻的两个观测到的报价链连接而成的直线上。图4-6b显示了线性插值抽样的方法。

图4-6　数据抽样方法

如图4-6所示，两种报价抽样方法产生完全不同的结果。

在数学上，两种抽样方法可以表示如下：

抽取收盘价时的报价：

抽取线性插值法的报价：

式中，是抽样报价的结果；t是期望的抽样时间（例如，新一分钟的开始）；tast是在抽样时间t之前的最后观测到报价的时间戳；qt，ast是在抽样时间t之前最后一笔报价；tnext是在抽样时间t之后的第一笔观测到报价的时间戳；qt，next是在抽样时间t之后第一笔报价的值。

图4-7和图4-8比较了作为收盘价格抽样并且插值的中间报价的直方图，频率为200毫秒和15秒。图4-9比较了收盘价和插值分布的分位数图。如图4-7和图4-8所示，抽样的分布是稀疏的，即比在频率较低时的分布抽样包含更多的零收益。同时，如图4-9所示，从插值报价计算的收益比收盘价更连续。

图4-7　“收盘价”的中间报价，以200毫秒间隔抽样（上）和15秒间隔抽样（下）

图4-8　“时间插值”的中间报价，以200毫秒间隔抽样（上）以15秒钟间隔抽样（下）

图4-9　分位数图：收盘价与插值的中间报价，以200毫秒为间隔抽样

比起将报价间隔操作为方便的规则间隔格式，一些研究人员研究了后续报价到达报价本身的时间间隔是否携带一定信息。例如，大多数研究者同意，对于禁止卖空的证券而言，交易的时间间隔确实会携带信息；交易时间间隔越短，越有可能发生了利好消息，接下来的价格变动就越大。

久期模型（duration mode）用于估计影响任何两个连续分笔数据之间时间的因素，这样的模型分别被称为报价过程（quote processes）和交易过程（trade processes）。久期模型也用于测量预定幅度价格变化之间的时间间隔和事先指定的交易量增长之间的时间间隔。处理固定价格运行的模型被称为价格过程（price processes）；估计固定交易量增量久期变化的模型被称为交易量过程（voume processes）。

久期通常使用泊松过程（Poisson processes）建模，这些过程假定顺序事件（如报价到达），彼此独立地发生。假设任意两个时间点t和（t+t）之间的到达个数具有泊松分布。在泊松过程中，每单位时间到达个数为λ。换句话说，到达以平均到达率（1/λ）发生。平均到达率可以假定保持恒定，或者假设可以随时间变化。如果平均到达率是恒定的，则在时间t和（t+t）之间恰好观测到k个到达的概率是：

Diamond和Verrecchia（1987）和Easey和O’Hara（1992）首先提出，序列数据到达之间的久期会携带信息。他们的模型假设在存在卖空限制的情况下，交易间久期可以表明存在好消息；在不允许卖空的证券市场中，久期时间越短，尚未工作所知的利好消息的可能性越高。反之亦然：在有限卖空和流动性正常的市场中，后续交易到达之间的久期越长，未观察到的坏消息的概率越高。但是，完全没有交易，则表明没有消息。

Easey和O’Hara（1992）进一步指出，由时间间隔分开的交易与彼此之间相连的交易所包含的信息内容是大不相同的。Easey和O’Hara（1992）结论的另一个隐含意思是，整个的价格序列都传递信息，应该在可能的情况下加以充分利用，这也成了支持高频交易的又一个论据。

表4-3显示了2009年5月13日SPY的所有交易而得的久期的描述性统计。如表4-3所示，在常规市场时间之外，交易间平均久期最长；在收盘前一个小时，（美国东部时间下午3：00～4：00），平均久期最短。

表4-3　2009年5月13日观测到的SPY每小时交易间久期分布

相邻交易间久期的变化可能是多种原因导致的。缺乏交易可能是因为缺乏新的信息，交易不活跃则可能是因为流动性水平低、交易所暂停交易或交易商的策略考量。Foucaat、Kadaa和Kaade（2005）认为，耐心地使用限价订单提供流动性可能本身就是一个有利可图的交易策略，因为流动性提供者应当因为其等待而获得补偿。补偿常常以买卖价差的方式进行，并且是限价订单被流动性消耗着“命中”所需等待时间的函数；交易间久期越短，其引致的买卖价差也就越小。然而，Dufour和Enge（2000）以及Saar和Hasbrouck（2002）发现，交易商观察到短的久期时，买卖价差实际上更高，这与基于时间的限价订单补偿假设相悖。

除了研究相邻交易和报价的久期之外，研究人员一直在建模，发展了用于描述固定证券价格变化和交易量变化的久期模型。前后价格变化达到特定幅度所需的时间间隔称为价格久期（price duration）。随着波动率的上升，价格久期会下降。同样，前后交易量变化达到预先设定规模所需的时间间隔称为交易量久期（voume duration），交易量久期会随着流动性的增加而减小。

利用交易量久期方法的变体，Easey、Lopez de Prado和O’Hara（2011）提出了基于交易量的高频数据抽样。在基于交易量的方法中，研究人员将一计时单位定义为交易量的一次“桶”，例如50个期货合约。当“桶”被装满时，交易量计时器便开始计时了。因此，当50合约交易量计时单位在50份合约交易相继到达时便开始计时了。当100份合约交易执行时，50份合约的成交量便计时了两次。

然而，报价、交易、价格和交易量久期所包含的信息会造成估算过程的偏差。如果可用信息决定了后续交易之间的时间，则时间本身不再是一个独立变量，这会造成估算过程的大量内生性偏差。因此，与价格序列的真实方差相比，传统的交易价格方差估计值过高。