bangst

学习进度

阅读时长

未满 1 分钟

最近阅读：未开始阅读

核心概念

待提炼

章节学习

1
赞誉
里什用简单易读的语言对量化交易进行了全面概述。这本书清楚地对不同类型的策略进行分类，解释宽客如何和何时进行量化交易。最重要的是，他帮助人们消除了宽客都是完全一样的观点，展现了量化交易中技术类型和策略类型的多样性。对于想了解这个领域的人士而言，这是一本优秀的读物。 ——沙克尔·艾哈迈德（Shakil Ahmed）博士，花旗集团做市商全球负责人看到里什，你怎
待学习
开始阅读
2
推荐序
我们所经历的能称为开创新篇章的事情少之又少。但是，我相信作为全球第二大经济体的中国，其资本市场的开放以及与之相关的投资市场的自由化和放松管制，将是全球市场发展过程中能达到这一高度的重要历史时刻。中国的发展使其更多地融入全球市场。中国政府不断开放更宽泛的经济要素范畴，充分提升中国市场的影响力。目前中国内地的投资者，或者借助中国香港市场的连接作用买卖证券，或者
待学习
开始阅读
3
译者序
2016年3月，备受瞩目的人机围棋大战落下帷幕。经过5局比赛，Alphago最终以4∶1的比分战胜韩国传奇棋手李世石。人工智能再次获得空前的关注。与此同时，将人工智能应用于资本市场的讨论也越来越多，人们开始研究其在投资决策中的应用，期待其在金融市场大放异彩。事实上，人工智能应用于资本市场的初期表现即为量化投资。量化投资是将投资思想转化为投资模型，借助于数据检
待学习
开始阅读
4
前言
历史是无情的主宰，根本没有所谓现在，只有不断成为未来的过去。保守的下场就是被扫出历史的舞台。 ——约翰·肯尼迪在相对默默无闻的投资管理领域，广泛被误解的有利可图的市场正快速发展。这个有利可图的市场被一直工作在这个领域的最聪明的人所主宰。他们在现代金融领域正努力解决一些最有趣且最具挑战性的问题。这个有利可图的市场有很多名字：量化交易、系统化交易或者黑箱交易。
待学习
开始阅读
5
致谢
非常感激我的兄弟Manoj Narang对于本书第四部分给予的帮助，感恩Mani Mahjouri提供的许多建议和帮助。感谢迈克·贝勒和Dmitry Sarkisov对信息微爆发提出的具有启发性的观点。我在T2AM的同事Myong Han、Yimin Guo、Huang Pan和Julie Wilson通读了本书的不同部分，给出了许多有价值的建议。如果没有编
待学习
开始阅读
6
深度思考的益处
文艺复兴公司的奠基人詹姆斯·西蒙斯（James Simons）认为，宽客带给投资领域最伟大的成就在于解决问题的系统化方法。正如西蒙斯博士所说的：“科学家带入这场游戏中的并不是他们的数学或者计算机技巧，而是科学思考的能力。”[1] 研究宽客最主要的原因之一是，宽客会深入思考那些非量化投资者认为理所当然的策略的许多方面。为什么会这样？毫无疑问，计算机是一种工具，
待学习
开始阅读
7
风险的正确度量和错误度量
正如本章所谈到的，错误度量风险是长期资本管理公司崩盘的原因之一。宽客天生喜欢执行包括风险暴露在内的各种度量。但是这种行为自身存在着优点和缺点。从积极的方面讲，一个好的构想的量化策略鼓励承担一定的风险。不同于接受偶然风险，纪律严明的量化策略要求精确划分所能接受的范围，并且将所能承担的风险控制在一定范围内。为了彻底清除这些风险，宽客必须事先知道这些风险是什么以及
待学习
开始阅读
8
遵守纪律
很多成功的交易者都很认同这么一句古老的交易格言：“亏损时要止损，盈利时要让利润奔跑。”但是，主观判断型投资者通常很难及时意识到发生了亏损，相反却会很快意识到盈利。这种已经被关注的行为偏差称为处置效应（disposition effect）[1]。但是计算机不会发生这种偏差。因此，遵守前面交易准则的交易者很容易将其交易策略程序化，使其每次运行都能遵守行为准则。
待学习
开始阅读
9
小结
国际投资界存在着形形色色的量化交易者，并占据着较大的比重。在世界各地的各种交易场所，各种金融资产的交易中，无论大型还是小型交易公司中都可以看到他们的身影。量化交易的成功和失败都会引起人们的关注，很多投资者从中受益。宽客合理配置和实施量化交易策略时所表现的完全性和严格性值得绝大部分交易者认真学习。同样地，在小心谨慎避免错误的前提下，宽客度量风险与各种市场敞口的
待学习
开始阅读
10
何为宽客
宽客（quant）通常会基于高深的理论构造追求超额利润，并系统地加以实施。宽客之所以被称为宽客，就在于他们会刻苦钻研交易策略的产生和实施过程。至于交易策略本身，宽客和主观判断型交易者并没有什么差别，就像上文所提到的配对交易和统计套利策略的例子那样。但是我们从未试图消除人们对于投资过程的贡献，毕竟我们只是在讨论宽客而不是机器人。恰如前文所提及的，不管是在跟踪标
待学习
开始阅读
11
量化交易系统的典型结构
理解宽客及其黑箱的最好方法是逐一了解量化交易系统的各个组成部分，这也是本书其余部分的框架。图2-1展示了一个典型的量化交易系统的框架。此图描绘了一个生动“有效”的交易策略的各个组成成分（例如，决定买卖哪些证券、买卖数量以及买卖时间），但不包括交易策略的所有必要元素（例如，设计交易系统所需的研究工具）。图2-1 量化交易策略的基本结构交易系统包含3个模块—
待学习
开始阅读
12
小结
宽客可能并不像想象中那么神秘。他们也是首先观察市场，产生一些普通人也会想到的想法，然后采用市场的客观数据进行研究来确定其想法是否正确，而不是基于传闻或经验甚至直接假设他们的想法是正确的。一旦宽客得到了一个满意的策略，他们会将其布置于一个量化系统中。这类系统在进行投资时，排除了情绪的影响，严格地执行经过测试的策略。但这并不是否定人在量化交易过程中的作用。宽客产
待学习
开始阅读
13
两类阿尔法模型：理论驱动型和数据驱动型
真正追求阿尔法收益的交易策略是少之又少的，这一重要事实并未被普遍认可或接受。实际上，这些基础交易策略的实现方式多种多样，从而由有限的几个核心策略衍生出花样繁多的交易策略。理解量化交易策略的关键在于，理解宽客科学地分析问题的视角。绝大部分宽客都是理工科出身，之后投身金融业，因此在其整个职业生涯中他们的理工科背景经常会左右其进行交易的策略选择。科学的两个重要分
待学习
开始阅读
14
理论驱动型阿尔法模型
绝大多数宽客是理论驱动型的。对于市场为何以现存方式运行，他们给出符合经济学理论的解释，并检验该理论是否可用于预测未来的市场行为。很多宽客认为其理论具有一定的独特性，这也是他们对自己的策略保密的一个重要原因。事实证明，这通常都是错觉。此外，许多量化交易圈外的人士认为宽客们所使用的交易策略都基于复杂高深的数学公式。这种看法也通常是错误的。事实上，这些交易策略既
待学习
开始阅读
15
数据驱动型阿尔法模型
这类模型有两大优势。首先，与理论型策略相比，数据挖掘明显更具有技术挑战性，并且在实业界使用很少。这意味着市场上少有竞争者，这是大有裨益的。由于理论驱动型策略通常易于理解，并且在构建相应模型时所使用的数学工具通常来说也并不复杂，所以进入的门槛自然会低一些。数据驱动型策略就没有这样的优势，进入门槛比较高。其次，数据驱动型策略可以分辨出一些市场行为，无论该行为目前
待学习
开始阅读
16
实施策略
无论是否使用量化方法，谋求阿尔法收益的交易者盈利的手段并不太多。但手段选择的有限性并不意味着所有的宽客与其他交易者完全相同，只能选择几种现象之一。实际上，量化交易模型千差万别，非常丰富，远远多于我们所想象的。这种多样性源于宽客实施其策略的方式多种多样。现在我们将注意力转向实施方式。一套实施策略值得深入探讨的有很多方面，包括预测目标、投资期限、投注结构、投资
待学习
开始阅读
17
混合型阿尔法模型
在定义交易策略时，宽客所做的每一个决策都是交易行为的重要驱动力。但在构建交易策略时，宽客还必须做出另一个极其重要的选择。具体而言，宽客并不局限于为给定的阿尔法模型选择一种实施方法。相反，他们具有选择多种阿尔法模型的自由。对这些阿尔法模型进行组合的方法就像充满了不确定性的竞技场。最高深也通常最为成功的宽客倾向于同时使用几种阿尔法策略，包括趋势跟随法、均值回复法
待学习
开始阅读
18
小结
在经典著作《信号与噪声》（The Signal and the Noise）一书中，纳特·西尔弗（Nate Silver）展示了预测方法之间略有不同的区别所在[1]。并非所立足的科学学科不同，而是如本章所展示的那样，所从属的统计学分支不同造成了它们的差异。贝叶斯统计学（Bayesian Statistics）是统计学中的一个重要分支，在进行预测时非常注重“
待学习
开始阅读
19
控制风险规模
规模控制是风险管理的重要内容。假如有一个很好的交易策略，看起来盈利几乎是确定无疑的事情，如果没有风险管理意识，就会诱惑着你把所有的资金都投入到这个交易中。但这通常不是个好的选择。为什么呢？因为从经验上看，很少有确定无疑的事情，所以控制交易规模最好的途径当然是“不要把鸡蛋放到一个篮子里”。否则很有可能发生的情况是，当投资者把所有的资金都投入进去，在某个时刻投资
待学习
开始阅读
20
限制风险种类
尽管控制敞口大小很重要，一些风险建模的方法仍致力于完全消除各种类型的敞口。假设投资者经过分析认为，雪佛龙公司（CVX）的表现会优于埃克森美孚公司（XOM）。假如投资者做出的选择是持有雪佛龙公司的股票而忽略埃克森美孚公司股票。如果之后市场形势急转直下，或者原油板块表现疲软，投资者在这笔交易中很可能亏损，即使交易的大方向选择是正确的。这是因为投资者暴露于市场方向
待学习
开始阅读
21
小结
风险管理通常被误认为是降低风险的操作流程，实际上是在给定的风险水平下通过选择敞口并控制其规模而最大化收益。毕竟，降低风险通常是以减少收益为代价的。所以，风险管理活动主要关注于消除或减少不必要风险的敞口，但也承担可能带来可观收益的风险。无论是采用系统化投资方法还是主观判断型方法，在这一点上都是一样的。二者的主要差别在于，宽客主要使用软件管理风险，而对于主观判断
待学习
开始阅读
22
定义交易成本
理解交易成本到底是什么是很有用的，因为我们正在描述对其进行建模的方式。交易成本主要由三部分构成：佣金和费用（commissions and fees）、滑点（slippage）以及市场冲击成本（market impact）。佣金和费用佣金和费用是交易成本的第一种类型，是支付给经纪商、交易所和监管者的费用，因为它们提供了服务，包括市场参与者的接入通道，有所
待学习
开始阅读
23
交易成本模型的种类
依据对于给定交易的交易成本如何计算，有4类基本的交易成本模型：常值型、线性、分段线性以及二次型交易成本模型。这些成本中有一部分是固定和已知的，如佣金和费用。交易成本模型把这些固定费用作为基准线，交易费用低于该基准线的交易根本不可能发生。另外一些成本，如滑点和市场冲击成本，都是变化的，在交易确实发生前不可能准确知道。滑点受到很多因素影响，如交易产品的波动率（如
待学习
开始阅读
24
小结
在构建投资组合模型过程中，交易成本模型告知进行交易的成本状况。它并非是为了极小化交易成本，正如阿尔法模型并不是创造收益而是进行预测并将这些预测传递给投资组合构建模型。成本最小化可以分为两个阶段。第一步，构建投资组合模型，使用交易成本模型提供的输入变量，去计算进行目标投资组合的成本；第二步，将目标投资组合传输到执行算法阶段，以尽可能低的成本去执行投资组合的交易
待学习
开始阅读
25
基于规则的投资组合构建模型
相等头寸加权相等头寸加权模型极其普遍。使用这一模型的宽客认为，如果某一头寸好到值得拥有，就不再需要其他信息来决定其规模。这里有个深层次的隐含假设：金融产品具有同质性，不需要根据其风险或其他指标加以区分。如上文所言，对于给定的金融产品而言，信号强度的概念与预测的规模有关。信号强度通常会被忽略掉，除非信号强度已经强到非常值得建立头寸。初看起来，对这一问题的处理
待学习
开始阅读
26
投资组合最优化
投资组合优化工具主要是基于资产管理行业的经典理论——现代投资组合理论（modern portfolio theory，MPT）的基本原理。MPT的核心原理是，投资者一贯是风险厌恶型的，这意味着如果两种产品收益相同但风险水平不同，投资者会偏好低风险产品。据此可以得到一个推论，只有存在额外收益作为补偿，投资者才愿意承担额外的风险。由此引入了风险调整收益（risk
待学习
开始阅读
27
宽客如何选择投资组合构建模型
我观察到，使用基于规则的权重分配系统的绝大部分宽客貌似都采用“绝对型的”阿尔法方法（如他们对单个金融产品加以预测，而不是对金融产品之间的相关关系进行预测）。这些宽客，即便不是全部也是绝大部分都是从事期货交易。而使用优化工具的宽客倾向专注于“相对”阿尔法方法，绝大部分应用于股票市场中性策略中。并不存在充足的理由可以解释相对型和绝对型阿尔法策略交易者各自偏好的投
待学习
开始阅读
28
小结
我们描述了两大类主要的投资组合构建模型。基于规则的模型采用启发式的方法，而投资组合优化工具则采用了现代投资组合理论的逻辑脉络。对于每一类，都存在很多种具体的技术，随之也带来了很多挑战。采用基于规则策略的从业者如何为其所选择规则的任意性找到合理的理由？使用优化方法的从业者如何解决和估计波动率及相关系数有关的许多问题？在选择“正确”的投资组合构建方法时，宽客必须
待学习
开始阅读
29
订单执行算法
一个有趣的话题是如何度量执行算法的效率。这里有几个主要的概念值得一提。第一个概念是中间市场价格（mid-market），反映的是对某一产品最佳买入价和最佳卖出价的均值（根据定义是指这两个指标的平均数）。这是判断交易价格是否公平最为标准的方法。例如，如果有买家能够以最佳买入价成交，这个价格显然低于当时的中间市场价格，这笔交易会被认为是以一个很有利的价格成交的（
待学习
开始阅读
30
交易基础设施
我们已经提到，为实施和完成电子交易，交易所和交易者间需要建立联系。此外，双方间的信息传递协议也是必需的。宽客在实施交易策略过程中所使用的硬件和软件都属于基础设施的最终组成部分。绝大部分情形下，宽客必须决定建立还是购买方方面面涉及的基础设施。由于监管的要求和其他条件的限制，绝大部分交易者使用第三方经纪公司作为其执行策略的代理机构，通过其提供的服务来完成交易。使
待学习
开始阅读
31
小结
对一个量化交易策略而言，我们已经详述了订单执行相关的方方面面。宽客必须做出的第一个选择是构建还是购买一个交易通道。构建世界级的交易基础设施的成本和技术难度，使得很多宽客（尤其是采用长期交易策略或交易小型投资组合的宽客）选择从经纪商或订单执行服务供应商那里购买这些服务。实际上，经纪商和服务供应商都为提供算法和连接服务而收费，这部分费用通常包含在佣金中。使用第三
待学习
开始阅读
32
数据的重要性
通常来说，模型的很多细节都是由所使用的输入变量的特征决定的。回到之前的例子，如果你得到的都是些缓慢变化的宏观经济数据，如美国每季度的GDP数据等；进一步假设在这些数据公开发布后一周你可以得到它们。这种情形下，你不可能建立一个快速交易模型并据此决定持有头寸的时间以分钟进行计算。此外，需要注意的是，你所得到的美国的数据在预测债券或货币相关产品时可能会比较有用，但
待学习
开始阅读
33
数据类型
数据基本上可以分为两大类：价格数据（price data）和基本面数据（fundamental data）。价格数据并不仅仅是和金融产品价格相关的数据，也包括从交易行为中得到或提取的其他信息。股票的交易量、每笔交易的时间及规模等都属于价格信息。实际上，整个指令簿都可以认为是价格数据，因为指令簿上包含有一个交易日中给定金融产品所有买入价和卖出价（以及量）的连续
待学习
开始阅读
34
数据来源
获取数据的来源众多。最为直接，也可能最具有挑战性的是，从源头直接获得原始数据。换句话说，宽客直接从纽交所（NYSE）得到在纽交所交易的股票的价格数据。这种做法的一个好处是，宽客可以最大限度地控制数据的清洗和存储，并且在速度上也具有很大的优势。但这么做也具有很高的成本。例如，需要与每一个数据源都建立联系，如果我们需要在多个市场和多个交易所交易多种金融产品（如股
待学习
开始阅读
35
数据清洗
我们已经探讨了数据的种类和数据的重要性，接下来我们讨论宽客在管理原始数据时会遇到的各种问题以及他们如何加以解决。尽管原始数据供应商、二手数据供应商以及第三方数据供应商都做了很多努力，数据仍然会出现缺失或错误的情况。如果忽视了这一点，这一问题会给宽客带来严重后果。这里我们对几种常见的这类问题加以讨论，并介绍一些用以解决这些问题的常见方法。值得注意的是，尽管以下
待学习
开始阅读
36
数据存储
通常使用数据库存储搜集到的数据以备后续使用，数据库一般有几种形式。第一种数据库是没有相对关系结构的平面文件（flat file），这种两维的数据库和普通的表格很类似。这种平面文件数据库不会因为需要加载太多内容而变慢，由于简洁而广受欢迎。这种简单的文件结构很容易进行搜索，通常是顺序搜索（如从第一行到最后一行）。但是，想象一下，在有着几百万条记录的平面文件中搜索
待学习
开始阅读
37
小结
本章中，我们解释了量化交易系统所使用数据中的一些基本概念。虽然数据很少是量化交易策略中令人兴奋的部分，但数据不可或缺，对宽客做的所有事情都很重要，为如何评价量化交易系统也会提供很多信息，因而值得加以深入理解。下面我们将研究过程作为对黑箱进行探索的最后一站（见图8-3）。图8-3 黑箱结构
待学习
开始阅读
38
研究蓝图：科学的方法
表现优秀的宽客共有的一个特征是，进行研究时遵循科学的方法（scientific method），当然也是其他研究领域研究的方法。这是非常重要的，因为科学的方法使得整个量化交易过程中重要的判断更严谨与更有纪律性。如果不严谨，宽客很容易因为痴心妄想和情绪化误入歧途而丧失逻辑一致性，而逻辑一致性在许多科学领域都有助于科学研究。第一，科学方法开始于科学家所观察的世
待学习
开始阅读
39
思想的产生
在理想的情况下，宽客在他们的研究中遵循科学的方法。就这一点而言，理论的发展（或者理论上可靠的数据挖掘方法）是研究过程的第一重要步骤。我们发现，思想的4个共有来源是：对市场的观察结果、学术文献、研究员或者投资组合经理在量化公司之间的迁移以及来自主观判断型交易者活动的教训。宽客提出他们的想法的主要方式是通过观察市场。这种方法最直接地体现了科学方法的精神。量化交
待学习
开始阅读
40
检验
样本内测试，又称为训练在量化交易中，模型近似于真实世界发生的现象。在模型中输入数据并预测未来。检验过程的第一个步骤是基于样本内数据寻找最优参数训练（train）模型。这听上去难以理解，我们将逐项解释。假设我们想测试一个策略：便宜的股票表现优于昂贵的股票。用收益率（earning yield，earnings/price）度量廉价，收益率越高暗示着股票越便
待学习
开始阅读
41
小结
我们已经对成功的宽客在研究中必须做的工作、必须做好的工作有了基本了解。在量化投资过程中，研究是一个高度敏感的领域。研究员的判断是最重要的影响因素。研究员必须深入细心研究，因为这是策略的形成阶段。研究阶段所犯的错误会深深烙进策略的任何部分，这个错误的系统化实施将是灾难性的。而且，研究不是一蹴而就的。相反，宽客必须连续进行有活力的和丰富多彩的盈利项目，以持续获得
待学习
开始阅读
42
模型风险
建模的不适宜性建模的不适宜性是一个根本的错误，它包含两种形式。第一种形式是对一个给定的问题进行错误的量化建模。例如，对一个音乐家的素质进行建模，从一开始就是错误的想法。人们可能会考虑音乐技巧相关的因素，诸如训练资源和持久性。但是最终，音乐家是否优秀这个问题并不是数学或者计算机模型所能回答的。这本身是一个主观问题，应用计算机模型本身就是一个错误。因为对于模
待学习
开始阅读
43
结构关系变化风险
许多量化模型都是基于历史数据。甚至那些利用分析师的预测或者情绪信号的模型也极大地依赖于历史，因为情绪通常偏向于历史趋势运行的方向。不论哪种模型，宽客都是利用过去的关联关系和行为开发理论和建立模型，以帮助预测未来。如果市场以一种特殊的方式运行了一段时间，宽客将会开始依靠这种持续的行为。如果结构关系发生改变，宽客通常会受到影响，因为关联关系和行为发生改变，这种影
待学习
开始阅读
44
外生冲击风险
第三种量化风险来自外生冲击（exogenous shocks），之所以称之为外生（exogenous），是因为它们主要不是由市场内部的信息所驱动。恐怖袭击、新战争的开端以及政治或者监管干涉都是外生冲击的例子。因为量化模型使用市场数据进行预测，当非市场信息对价格产生影响，量化策略会受到影响。事实确实如此，因为这些冲击通常会导致股价运动趋势大于平常的幅度。所以，
待学习
开始阅读
45
蔓延风险和同质投资者风险
量化特有的风险新成员是蔓延风险（contagion）或者同质投资者（common investor）风险。这类风险不是因为策略本身，而是因为其他投资者持有同样的策略。在许多情况下，这些策略被其他投资者作为投资组合的一个部分，而这些投资组合经常包含一些倾向于定期表现欠佳的金融产品。首先，这个风险因素和策略使用的人数相关。其次，与其他投资者持有的别的因素相关，这
待学习
开始阅读
46
宽客如何监控风险
在对量化交易特有风险讨论时，也值得对引起这些风险的量化交易特有的工具进行讨论。第7章相当详细地描述了风险模型，这些模型能够寻求降低或者控制投资组合中的风险敞口规模。但是宽客也利用各种不同的软件去监控这些风险敞口、监控它们的系统和本章描述的各种各样的量化特有的风险。存在着各种各样的监控工具、最著名的是敞口监控工具、利润和损失监控工具、执行监控工具和系统性能监控
待学习
开始阅读
47
小结
量化交易会给投资者和参与者带来潜在的利益，其纪律性、计算能力以及科学严谨性为投资者在高度竞争环境下遇到的盈利挑战给予支持。然而，宽客也有一系列需要处理的问题。这些问题中的一部分对于宽客而言是特有的（例如，模型风险），但是大部分问题对于量化策略而言，比主观策略更重要（例如，同质投资者或蔓延风险、外生冲击风险、结构关系变化风险）。宽客利用各种各样的工具监控系统和
待学习
开始阅读
48
交易是一门艺术，不是科学
市场主要由人们对所接收信息的反应而驱动。不是所有的信息都可以系统地被理解。而且，不同的人对同一信息片段认知也不同。如果公司的首席执行官被解雇了，是好消息还是坏消息呢？一个交易员可能认为这意味着领导层的不稳定性，从而认为是一个坏消息。另一个交易员可能认为首席执行官应该被解雇，这是董事会的一个明智决策，公司目前经营状况很好。事前，无论哪种认知都无法证明是正确的。
待学习
开始阅读
49
由于低估风险，宽客引起更多的市场波动性
这个批评既包含真实成分，也包含虚假成分。许多基金经理，包括宽客在内会受到模型风险基本类型的影响，即提出了错误的问题，使用了错误的技术（诸如VaR技术），做出许多关于市场的错误假设，试图将风险表示为一个数字，这个目标看上去是毫无意义的。而且，正如2007年8月量化清算危机中所解释的，宽客低估了在大规模的、拥挤的交易策略中的下跌风险。这也源于量化交易的根本缺陷。
待学习
开始阅读
50
宽客不能应对市场行情中的不寻常事件或快速的变化
这或许是对量化交易最合理的批评。宽客必须依赖于历史数据才能对未来进行预测。这种依赖性的结果是，当市场发生重大或者突然的改变时，很可能会遭受损失。值得重复强调的是，除非市场体制变化特别大并且没有任何警示，否则对宽客的影响会比较小。也许量化交易最具挑战性的时间段是2007年7月下旬到2008年8月。在这大概13个月的时间里，宽客（尤其那些执行股票市场中性策略的宽
待学习
开始阅读
51
宽客完全相同
这个言论也被广泛认可，尤其是在2007年8月许多宽客极具灾难性的表现之后。然而，我确认这是一个明显错误的言论。我们将聚焦于这个说法的理论性和实践证明，从理论证明开始。这本书已经列出了宽客在建立量化策略过程中必须做出的许多决策。这些决策包括交易的金融工具和资产类型、数据来源以及如何清理数据、研究和发展交易策略的方法、互相结合的预测方法、预测需要提前的时间、赌
待学习
开始阅读
52
长远来看，只有少数几个大型量化公司能够蓬勃发展
我曾听到许多观察量化交易的人无数次地引用这一批评观点。初看上去，这个观点是很有道理的，整个事情是这样的：最大规模的资金最充裕的宽客能够将最多和最佳的资源注入黑箱，最佳资源包括从数据到执行算法的各个方面，能够与他们的服务供应商进行谈判，获得更有利的条款。基于这个假设条件，他们能够比规模较小的同行表现更好是合理的。最终，规模较小的宽客将会因业绩不佳或投资者间的摩
待学习
开始阅读
53
宽客在数据挖掘中存在错误
在金融业，数据挖掘可谓臭名昭著。实际上，最应该进行批评的是与它可交换的另一种术语：过度拟合。数据挖掘是一个实证科学，是第6章讨论的主要学科框架中的一个。一般数据挖掘技术被理解为利用大量数据获取所发生事件的信息，并不关心事件发生的原因。数据挖掘和理论驱动型科学最大的不同在于：为了相信自己能正确预测未来发生的事情，理论家对理解事情为什么发生会很感兴趣。然而，正如
待学习
开始阅读
54
小结
量化交易不是万能的，确定有宽客应该对这一章所提到的某一个批评或者所有批评承担责任。一些人做的是伪科学，低估了风险，在市场条件突然改变时损失金钱。一些人执行陈腐的被反复使用的策略，一些人利用有限的数据过度拟合模型。但是这些批评中的大部分同样适用于主观型交易者。做得好的话，量化交易能够产生优秀的调整风险回报率和大量的分散投资收益。那么，量化交易做得好意味着什么
待学习
开始阅读
55
收集信息
在详细叙述沙尔夫的技巧之前，我想强调，我既不是战争和审讯的狂热爱好者，也不想将投资者和量化经理的关系比作审讯者和受审者之间的关系。但是我相信，两者之间有一个相似点使得后者所得到的经验教训对前者有用，相似点是：一方不愿提供的信息是另一方需要的信息。沙尔夫使用的第一个技巧也是最明显的技巧：他与所要谈话的飞行员建立信任关系。事实上，战后，沙尔夫与很多受审讯的飞行
待学习
开始阅读
56
评估量化交易策略
在评估和创建量化交易策略的这些年里，我注意到一个极其有趣的事实：大部分情况下，宽客所做的工作与投资组合经理、CEO或者资源分配者的工作类似。毕竟，这些资源（例如，时间或者金钱）是有限的，必须利益最大化地进行投资。投资过程包括6个主要的内容。（1）研究和发展策略；（2）数据搜寻、收集、清洗以及管理；（3）投资选择和构造；（4）投资组合构建；（5）执行
待学习
开始阅读
57
评估量化交易者
在本书中我尽力强调一些事情，那就是对量化交易者的判断需要涉及他所建立的策略。所以，评估宽客时，评估与交易策略相关的技能和经验明显很重要，但是说起来容易做起来难。这部分列出了用于判定量化交易者技术水平的工具。开发和管理量化策略的人在所使用的方法上应该受过良好的训练。至少团队的一些成员在与策略相关的量化交易领域，有大量的实战经验。经验有助于做出很好的判断，尤其
待学习
开始阅读
58
优势
类比是一个好方法。一个缺乏经验的宽客在遇到一点意外灾难后，可能放弃模型。他可能清算投资组合或者大量降低杠杆。然后，只是基于模型执行较好的小样本进行投资，可能允许继续积累头寸进行组合投资。但是，正如我们所看见的，交易是昂贵的，偶尔会适得其反（如2007年8月的宽客清算事件和2010年的闪电崩盘事件）。宽客在遇到基金损失时，经常会采用次优的方案，第一反应经常会毁
待学习
开始阅读
59
评估宽客的诚信
大部分宽客和普通交易者是诚实和有道德的。因此，基于“信任但需要核实”的基础，与他们建立合作关系是非常合理的。换句话说，对于大部分评估过程，假定交易者声称的母校、文凭以及自己不是罪犯等信息是真实信息，这是合情合理的。但是在做出投资决策之前，许多观察者认为，应该尽可能核实宽客的道德观念。这里，有几个可自由支配的工具。首先，进行背景核查、教育背景审查以及征信调查
待学习
开始阅读
60
宽客如何适应投资组合
假定你发现一个宽客值得雇用或进行投资，你不得不对如何给这个交易者分配资金做出决定。在做出决定之前，你必须理解策略是否适用于你的其他投资组合头寸。这很大程度上是平衡不同类型的风险敞口问题。本节将详细描述几种与量化投资相关的重要风险敞口。阿尔法投资组合首先，值得记住的是，投资组合构建是风险敞口分配的问题。包含较多风险敞口的投资组合比包含数量较少的风险敞口的投
待学习
开始阅读
61
小结
为了评估宽客和量化策略，投资者必须理解所执行的策略、策略特征以及策略产生过程的活力状态。为了做好这些，投资者有3个武器可供支配：建立信任、尽可能获得量化交易的相关知识、所获得的信息尽可能有条不紊。对于既定的宽客和量化交易而言，这些工具通常可以用于提取和整合信息。最后，投资者必须判断宽客是否有优势，优势根源是什么，优势可以支撑多长时间，未来会面临什么威胁。优
待学习
开始阅读
62
第13章高速及高频交易概要
昨天晚上，我在酒店关闭开关，然后以极快的速度在整个房间变暗之前上床。 ——穆罕默德·阿里 2009年早期，市场刚刚从恐慌甚至近乎绝望的状态中恢复。这时，新闻媒体报道，2008年金融市场中为数不多的盈利者是一种新型的交易公司——神秘的量化交易公司，它们被称作高频交易者（high-frequency traders，HFT）。他们并不会在出版、管理等流程上花费太
待学习
开始阅读
63
速度的重要性
现今电子市场，有助于理解速度重要性的最好方法就是理解不同类型订单速度如何。毕竟，无论哪种阿尔法类型、风险类型以及投资组合构建模型类型，订单才能体现策略的完成过程。虽然有许多种类的订单，尤其考虑到世界上各种交易所时，但是订单通常被分为被动类型和积极类型。而且，一些订单（被动订单）一旦被搁置，可能被取消。我们将描述能够捕捉世界上大部分订单类型的3种情况：放置积极
待学习
开始阅读
64
延迟根源
很清楚，对于负责大规模资金的交易者而言，使用低延迟交易平台是很重要的。现在，我们将注意力集中在交易者可控制的潜在的延迟原因，以及针对这些原因能采取的措施。市场内外的传输对于算法执行引擎，第一个潜在的延迟原因来自获取数据的时间和订单进入市场的时间。一个好的执行引擎大部分的工作包括对市场改变的快速反应，逻辑上，实时访问这些改变是业务的第一步骤。而且，在你做出
待学习
开始阅读
65
小结
本章，我们详细阐述了高速度（或者低延迟）重要的原因以及延迟的根源。依据交易的类型或者所实施的交易策略，注重速度的原因有所不同。虽然这带来了媒体上的大量负面关注，但是这与其他行业的处境绝对没有任何不同。如果在游戏竞争规则范围内发展优势，那么大部分有竞争性的玩家都会寻求发展其优势。但是，通常情况下，对于量化交易，当遇到高频交易和低延迟交易时，会有双重标准。人们看
待学习
开始阅读
66
契约型做市
两个客户同时反向地做一件事情的概率是相当小的（例如，顾客A想以100美元的价格购买XYZ股票2000股，而顾客B想以100美元的价格卖出XYZ股票2000股）。当然，有一定比例的交易意愿可以被实现是很可能发生的。以上面的例子为例，也许顾客A想购买2000股，而顾客B想卖出5000股。剩下渴望卖出的3000股可能在后面的时间里卖出（通常在不利于卖家的某个时间）
待学习
开始阅读
67
非契约型做市
考虑到他们依赖于被动订单，任何市场所暴露的最大风险都是逆向选择。一个订单的一面的做市商希望能够快速成为另一个订单的另一面的做市商，盈利至少等于买卖价差。或者，根据市场运动情况，能够积极地退出，从而获得盈利。这就是“低买高卖”但修改为“低买，速度极快并重复地以稍微高的价格卖出”的具体体现。确实，正常缺乏短期趋势情况下，这是可能实现的。但是，首先，速度足够快这
待学习
开始阅读
68
套利
另一种套利类型是跨市场套利（venue arbitrage），这仅存在于分散的市场。跨市场套利主要利用分散的市场结构（意味着有许多交易所允许交易同一金融产品），有时会引起不同的交易地点、同一金融产品的价格有所不同。这里，金融工具不仅是与另一金融工具结构化相关，实际上，是同一金融产品在多个地方进行交易。与指数套利机会存在同样的原理，跨市场套利机会也存在。在美国
待学习
开始阅读
69
快速的阿尔法策略
预测方向的类型也是如此，预测是基于历史行为对未来行为进行推断。例如，如果一些金融产品连续几秒钟创出新高，之后将会下降是一个好的机会。但是这仍然是一个偶然事件，金融工具过去的表现和未来表现之间的结构关系不是引起保持回报策略的原因。一些快速的阿尔法策略是很被动的。例如，日内统计套利。从它们被动地防止提供流动性订单这个意义上来看，它们可以被认为非契约型做市商的近
待学习
开始阅读
70
高频交易风险管理和投资组合构建
很多时候，高频交易策略的风险管理与相对较慢的交易的风险管理有所不同，即使对于类似的策略主题（例如快速阿尔法类型中的策略）。考虑到风险因素，例如，交易成本模型及对优化的不同输入会花费宝贵的计算时间，这将放慢完成阿尔法策略的过程。而且，大部分长期策略想对冲的风险因素很少应用于隔夜证券市场。例如，一些长期交易者关心平衡规模因素（实质上是市场资本规模）的敞口。他们并
待学习
开始阅读
71
小结
我们已经探寻了高频交易者使用的几种策略。你可能注意到高频交易策略和第3章描述的阿尔法策略有一些显著的不同点。确实，私下里，许多高频交易参与者会告诉你，他们根本不考虑阿尔法策略。即使他们确实这样做了，阿尔法策略也是技术面关注的最佳备选，主要风险是失去速度优势。当你看到这两种策略已经被利用，并且归因于速度慢而受到惩罚（第14章有所描述），为什么会是这样就很清楚了
待学习
开始阅读
72
高频交易创造不公平的竞争了吗
2009年，T.Rowe Price的高管安德鲁·布鲁克斯（Andrew Brooks）谈道，“但是我们正向高频交易套利者和其他类型交易的两层市场前进，人们想知道他们有获得公平交易的权利。否则，市场将失去公平性”。[1]这个争论背后的观点是超速计算机、算法和通信设置都非常昂贵，普通人难以利用这一点，他们创造了双层体制，而高频交易者在其中具有很大的优势。这并不
待学习
开始阅读
73
高频交易导致老鼠仓交易或市场操纵吗
高频交易者被指控为老鼠仓（front-running）投资者。这是一个很有热度的话题。但是不幸的是，能够检验这个话题的可靠例子又很少。至于市场操纵，在具有特定争论的稀有例子中，批评者指出例如塞单（quote stuffing）现象，即防止或者取消大量订单，目的是干扰其他投资者进而犯错。另一类受欢迎的批评者认为，是“高频交易者的计算机本质上能够吓唬慢的投资者放
待学习
开始阅读
74
高频交易导致更大的波动性或者结构不稳吗
偶尔，计算机软件会有小故障。当一个故障导致数百万的订单错误，成为市场价格大量不稳定的原因时，人们会担忧。而且，在一些人的代码中即使没有这些小错误的出现，类似2010年的闪电崩盘事件，仍会使得高频交易者应对极端市场波动性负责的推测沸沸扬扬。确实，尽管有大量的证据反对这一观点以及缺乏支持这一观点的理论，仍有相当广泛的人认为闪电崩盘是计算机驱动事件。尽管美国证监会
待学习
开始阅读
75
高频交易缺乏社会价值吗
这也许是我听过的对高频交易最令人失望的争论。实际上，惹人发怒的原因与高频交易一点关系也没有。从哲学的观点来看这是有问题的，令人失望的是这个观点被许多作家所接受。诺贝尔奖得主经济学家保罗·克鲁格曼在《纽约时报》的专栏上指出：高频交易通常是一个游戏中的“坏角色”（bad actors），“很难看见那些防止订单速度比别人快1/13秒的交易者是如何促进社会功能的”[
待学习
开始阅读
76
监管注意事项
计算机是个强大的工具。工具越强大，威胁（或者好处）确实越大。虽然要求详细的审查和合理的监管，但并不要求禁止使用强大的工具。尽管有来自市场一些焦躁的言论，但美国监管者出人意料地冷静，对这件事情考虑周全。迄今为止，对于高频交易所走的每一步看上去都很公平。禁止裸接入是一件合理的事情。证监会有关闪电崩盘的报道是具有颠覆性的，非常准确，或多或少将责任（不是指责，灾难
待学习
开始阅读
77
小结
总的来说，我尽量说明白一些，高频交易不是由邪恶的人们所操纵。他们遵守市场规则和公共准则，具备良好的意识。他们经常对当局主动汇报由他们交易引起的不合规行为。强大的计算机和快速的通信线路可能被用来操纵市场并不意味着利用这些工具进行的活动会被停止。正如用假炸弹制造威胁的人将被指控一样，操纵市场、进行老鼠仓交易以及其他坏行为也应该被指控，但是没有证据表明程序化交易者
待学习
开始阅读
78
第17章量化交易的展望
所有思想和行为的演变必须首先显示为异端和不当行为。 ——萧伯纳所谓的黑箱交易已经存在了30多年的时间。对于读者而言，更清楚的是，这些策略与其说是黑箱，不如说是交易者和投资者已经做过的事情的系统化实施。不幸的是，自动化过程经常伴随着危难。有时候，这是易于理解的，即人的工作岗位被自动化所取代。其他时候，无知成为恐惧的充分原因。不论哪种情况，我相信强烈反对宽客的
待学习
开始阅读

Reader

章节阅读

Local EPUB Text

检验

样本内测试，又称为训练

在量化交易中，模型近似于真实世界发生的现象。在模型中输入数据并预测未来。检验过程的第一个步骤是基于样本内数据寻找最优参数训练（train）模型。这听上去难以理解，我们将逐项解释。

假设我们想测试一个策略：便宜的股票表现优于昂贵的股票。用收益率（earning yield，earnings/price）度量廉价，收益率越高暗示着股票越便宜。但是收益率高到什么水平才能足以表明股票未来表现优秀。收益率低到什么水平暗示股票昂贵并且很可能未来表现不佳。这些水平就是参数。通常来说，模型的参数是定义模型的某些方面并影响其表现的变量。这些变量可以被设置为任何值，通过改变这些变量值，模型本身将被改变，将提供不同的结果。

想象你雇用一个顾问帮助你购买理想的“最优”房子。顾问列出了可能影响你的决定的相关变量，例如房子的大小、购买时的房屋状况、地理位置以及相关学区。如果你不告诉他这些变量的理想值，他将通过观察你对不同房子的反应进行推断。你对贫穷社区的大房子并不感到满意，对富人社区的小房子可能更感兴趣。使用这种方式，顾问可以推断你不喜欢第一种社区，更喜欢第二种社区。进一步，相对于房子大小而言，社区可能对于你来说是更加重要的因素。如果他能够重复这些“实验”，他将能够调整供你选择的目标，直到找到你最满意的房子。顾问的努力得到回报，他很好地完成了工作。

同样，量化模型的最优参数是能够达到最优表现的参数，无论测量模型优劣的标准是什么。训练模型包含寻找最优参数集，这通常是通过测试许多组数据集，并希望至少有一个数据集使得结果具有吸引力而实现的。是什么构成吸引力，我们将立即详细讨论这个问题。但是我们首先考虑样本内研究的一些其他方面。

在某种意义上，对于宽客而言，样本内研究是件有趣的事情。在真实世界，宽客的模型不断地受到新信息和不可预知的事件的挑战。但是样本内的历史数据对于整个模型是已知条件，没有必要对已知条件进行预测。样本内数据就像小学生测试的答案要点，这是模型运行最好的区间，因为模型不必做任何预测。模型不得不做的是结合适用于审核的整个数据样本，合理地解释样本内数据。这是研究过程中值得高度期望的一个部分。

样本内测试的过程包含一个重要的决策：究竟是什么构成拟合模型的样本？样本有两个特征：宽度和长度。想象一个研究员想构建一个基于美国大约5000只上市股票的策略，1990年至目前的数据可供他支配。就样本内测试的宽度而言，研究员对使用的股票数量以及如何选择这些股票做出决定。他是应该使用所有行业及市值水平的更广泛的跨行业股票呢，还是应该使用相对狭窄的跨行业股票，还是应该选择所有股票呢？对于时间长度而言，研究员必须考虑适用于拟合模型的数据窗口。最近的数据更合适还是更古老的数据更合适？相对较小时间窗口的随机数据集更合适，还是1990年以来的整个数据集更合适？宽客通常喜欢使用一个时间段的所有金融工具数据，但这绝不是通用的，因为这里需要权衡利弊。

通过使用更多的数据，宽客构建的模型适用于更广泛的情景和市场环境，这使得模型更稳健。在真实条件下，模型会成功，是因为模型已经可以“看见”和适用于大量样本内数据包含的情形与环境。另一方面，模型允许使用的数据越多，当被调整的时候，构建模型的风险就越大，此时的模型仅仅能对过去进行很好的解释。基于这个原因，许多宽客使用交叉数据进行样本内检验和模型拟合检验。

“良好的”模型的组成部分

宽客使用各种方法度量模型的“好坏”（goodness）。无论对于样本内数据还是样本外数据，都是真实存在的，我们将在下一个部分讨论后者。这里先说明宽客可能使用的一些统计量（以及其他输出量）。我采用预测标准普尔500指数的策略解释这些度量指标。预测的期限是一天，使用众所周知的股票风险溢价（equity risk premium）方法进行调整，通过计算每天标准普尔500指数和10年国债收益率的差进行衡量。如果标准普尔500指数收益率高于债券收益率，这被看作做多股票的信号。如果标准普尔500指数的收益率低于债券收益率，则被看作做空股票的信号。我在20世纪90年代中期建立这个策略，旨在用于战略性资产配置，但我从未进行交易。因为使用下面这些度量指标度量以后，就会明白不进行交易将是显而易见的事情。这个例子简单地表明策略在真实世界使用真实资金实施之前需要首先通过检验。这个例子的策略结果是基于1982年6月至2000年12月的日收盘价而得到的。

1.累积盈利图

累积盈利图是检验过程最有力的输出量，因为正如人们所说的，一图胜千言。从累积盈利图可以看出，策略能否盈利、平稳性如何以及存在着何种下行风险，适用于哪些情况。正如图9-1所显示的，这个策略在测试阶段时持续盈利，但回报流是呈波浪起伏的，而且很长一段时间内不够活跃（一些情况下持续几年），有时大幅亏损，有时获得巨额盈利。研究员能够立即看出这个策略存在着实际问题。从1989年后期到1995年早期，以旁观者身份几乎不进行交易，当然确定没有盈利是否现实呢？

2.平均收益率

平均收益率表明策略在过去实际运行情况如何（即盈利情况如何）。如果策略在测试阶段效果不佳，那么实际情况下策略就不可能奏效。正如后面所看到的，测试让研究者相信，交易中盈利是一件极其容易的事情。令人遗憾的是，这种错觉主要归因于大量的致命陷阱。在标准普尔500指数的例子中，仿真实验中的总累积盈利达到746%，在没有去除交易成本和佣金之前，年化收益率达到12.1%。

图9-1　标准普尔500指数策略的回测累积盈利图

3.收益率随时间的变异性

收益率随时间的变异性描述的是平均收益率的不确定性，该指标有助于研究员判断是否应该持有某交易策略。通常情况下，收益率变异性越小，策略越优。例如，某策略年平均收益率为20%，年标准差为2%（即在67%的时间里，年收益率在20%-2%至20%＋2%的范围内，即在18%和22%之间）。这个结果相对于年平均收益率为20%，年标准差20%的策略（即在67%的时间里，年收益率在0和40%之间）要更好。这个思想使得研究员应该对不确定性较低的既定收益率的策略更有信心，更有信心明显是一件好事情。

在我的公司，我们关注一个统计量：块度（lumpiness），指的是显著高于平均收益的时间段内的收益占策略总收益的比例。这是另一种测量收益一致性的方法。尽管度量指标很重要，但一致性并不总是主要的目标。不过，知道投资者或者策略的从业者所期望的目标是一件好事情，即使只能识别到策略行为发生改变的时间。在标准普尔500指数的策略中，整个测试阶段的日化收益率的年化标准差是21.2%。

4.波峰波谷间的最大降幅

波峰波谷间的最大降幅测量的是盈利曲线中从任意一个累计波峰开始的最大回测。如果策略盈利10%，然后亏损15%，再然后盈利15%，那么这个阶段策略的整体收益率大约是7.5%。然而，波峰和波谷的降幅达到15%。另一种陈述方法为：投资者为了获得7.5%的盈利，必须承担15%的风险。策略的回测越低，策略越优。许多宽客不仅仅分析一个回测，而是分析多个回测以了解他们策略的极端和常规下行风险。分析下跌之后的恢复时间也很重要，有助于研究员理解模型极差表现之后的行为。回复时间较长通常是不受欢迎的，因为这暗示着，如果策略在某个时间发生大量损失，将在很长时间内保持负值。标准普尔500指数策略在回测时的波峰波谷间的最大降幅为-39.7%，这是由于1987年夏天做空标准普尔500指数所造成的。实际上，1987年10月崩盘之前，策略看上去表现不错。

然而，下跌信息必须谨慎处理。如果从1990年至1997年，8年（在对冲基金里面被认为是较长的跟踪记录时间）的可转换债券套利策略数据可以看出，降幅很有限。但是1998年，这些策略表现极差。存在的问题就是样本偏差（sample bias），这表明所使用的判定“最坏”降幅的样本并不是整个可能结果的良好代表。相反，虽然回测时间很“长”，覆盖了有利于策略的整个时间段，也将低估潜在的下行风险。对于这个问题，并没有太多的解决方案：计算下行风险的样本要么足够大，以至于能够覆盖很大范围内的市场体制以及有利的和不利的环境（尤其与策略测试相关的环境），要么不能覆盖。如果样本并不足够大，不能代表所有可能情况，那么宽客只能对环境变得恶劣时的最坏亏损做出一些判断。很明显，这个判断很大程度上依赖于研究员的判断。即使这样，这最多也只是一个粗略估计。

此外，最大历史下行也仅仅是一个有偏样本产生的可能结果。想想历史收益分布像一副纸牌。如果我们按照纸牌的原有顺序翻转纸牌，将得到历史时间序列。然而，如果重新洗牌，按照新的顺序翻转纸牌，将得到不同的时间序列。如果反复操作成千上万次，理论上讲从一个真实历史数据可以得到许多可能的结果。这种方法被称为重复采样（resampling），这样可以提升历史样本的效率。基于这些成千上万的历史重复采样数据，可以计算出每一种情况的最大下行，对策略的潜在下行风险估计更稳健。对于识别纸牌中可能某一天置我们于死地的情况，这是一个明智的做法。我们担心，他可能包含着太多的A（aces）和王（kings），而并没有太多的2和3。

5.预测力

统计量R2（R-squared）表示预测模型解释被预测量的变异程度，换句话说，就是被预测量被信号解释的变异程度。其值在0~1，有几个有效的方法进行计算。用户可以利用许多统计包（包括Microsoft Excel）很容易地计算出R2。值为1意味着模型解释了被预测量变异100%的信息。如果不是特别说明，当我们谈到“被预测量”时，当然是指向进行交易的股票、期货合约或者其他金融产品。在量化金融领域，毫不夸张地说，我们试图预测期货价格/收益率/一些金融产品的趋势，使其R2为1是不可能的，除非方法是错误的。事实上，在这个行业，R2为0.05就是极好的了（参照后面章节讨论的样本外数据）。我的一个前员工曾说道，“如果你没有犯错误并且R2高于0.15，换个方式重新处理，因为如果你使用这个策略，证监会将会认为是内幕交易而逮捕你”。注意到，R2等于0.15意味着预测模型描述了被预测目标未来变异的15%信息。正如另一个量化交易者所谈到的，“人们认为0.02的R2的模型就是很好的模型”。图9-2显示了1982~2000年的标准普尔500指数策略的R2低于0.01。

图9-2　标准普尔500指数策略指数的R2

宽客经常使用别的方法衡量预测力。这个方法是在检验中按照十分位数（或者研究喜欢的其他分位数）的方法对金融产品的潜在预测的收益率进行分组。通常情况下，具有可靠预测力的模型能够显示最坏的收益情形出现在最坏的预测收益情形中。实际上，改善的预期收益的每一个分组表现优于前一个。如果被预测的金融产品的收益不能随着预测而改进，则暗示着这个策略只是偶然地发生作用。

图9-3的柱状图显示的是按照五分位数对标准普尔500指数策略的研究结果。正如图形所看到的，至少在这个研究中，策略看上去是合理的。最左边的信号结果与标准普尔500指数平均-2.35%的收益相吻合。确实，这是所有标准普尔500指数平均收益中的最坏结果。从左边开始的第二个分位数组表示的是标准普尔500指数策略的第二个最坏结果，平均收益率为-0.19%。我们逐步转移到牛市信号，标准普尔500指数收益率继续改善，与预测行情上涨相一致，这也是人们所期望的。每一个分位组的收益率高于前一个分位组的事实表明阿尔法信号（早些修正的股票风险溢价信号）与预测目标（第2天的标准普尔500指数收益率）之间的单调关系。

图9-3　按照五分位数对标准普尔500指数策略的信号和收益率之间的关系研究

6.胜率或盈利时间占比

胜率这个百分比是一致性的另一种度量方法。这个指标告诉研究者系统盈利是来自小比例的偶然表现极其优秀的交易，还是来自很多交易，每笔交易可能都贡献微小的利润。类似地，可以使用盈利周期与总周期数的比值简单度量（这通常是用胜率或者盈利天数百分比进行度量）。对于两种度量方法，人们对具有更强一致性的策略具有更多的信心。在标准普尔500指数策略中，研究结果有点不寻常，因为策略并不是每天产生信号，而仅仅当模型察觉到机会足够具有吸引力时才产生信号。既然这样，模型会在65%的时间里产生0信号，19%的时间里产生盈利交易，16%的时间里产生亏损交易。在非零信号的交易时间里，大约54%的时间里获得盈利。对于一个策略而言，这也不是一个太糟糕的结果。

7.回报相对于风险的不同比率

许多统计量被用来度量调整风险收益（risk-adjusted return），通常都是设法度量获得一些收益的“成本”（以风险的角度）。典型的例子是以威廉·夏普命名的夏普比率（Sharpe ratio）。1990年，威廉·夏普与哈里·马科维茨一起获得诺贝尔经济学奖。夏普比率是通过计算某周期内高于无风险利率的平均收益率与收益率的波动率之间的比值可得。夏普比较越高，策略越好。宽客（以及投资管理领域的许多人）通常去掉比率（ratio）以简化这个名称。夏普值为2的策略是指每承担1个单位的风险，将会获得2个单位的高于无风险利率的收益率（如果能得到这个结果，这是一个相当好的夏普比率）。

和夏普比率相近的比率是信息比率（information ratio），不同之处在公式中去除了无风险利率。标准普尔500指数策略的信息比率仅为0.57，意味着投资者每承担1%的风险，可以获得0.57%的收益（此外，这个结果是在扣除交易成本和实施策略的其他费用的成本之前）。斯特林比率（Sterling ratio，平均收益率与低于平均收益率的波动率），Calmar比率（Calmar ratio，平均收益率与波峰波谷间最大回测的比值），Omega比率（Omega ratio，正收益率之和与负收益之和的比值）也是广泛应用于调整风险收益的度量指标。1982~2000年的标准普尔500指数策略显示斯特林比率为0.87，Calmar比率为0.31，Omega比率为1.26。在这些比率中，最让人失望的是较低的Calmar比率，这个结果意味着承担1%的回测风险，能够产生0.31%的收益。

8.与其他策略的关系

许多宽客会同时使用几个策略。这样，宽客有效地管理策略组合，这与其他类型的投资组合一样，分散风险。宽客需要频繁地测量新策略如何适应于其他已经使用的策略，确保新策略能够增加价值。毕竟，不能改进投资组合的好思想最终也没有用处。虽然计算新策略与现存的投资组合策略之间的相关系数是件寻常的事情，但许多宽客通过比较现存策略的结果和加进新思想后的结果，度量新策略的新增价值。结果的显著改进表明新策略和现存策略之间存在着协同关系。

9.时间延迟

在检验策略时，一个有趣的问题是，策略及时获得信息的敏感性如何，预测效果会在市场中持续多长时间。许多宽客寻求理解，如果他们必须在接受交易信号后才开始交易，这个交易有一些延迟，那么策略的收益将会如何。换句话说，如果2006年4月28日，策略开启一个卖出Microsoft（MSFT）的信号，宽客将能看见MSFT没有被允许卖出的一天、两天、三天等多天时间内策略的表现。通过这个方法，可以判断策略对接收信息及时性的敏感程度，也能获得策略拥挤程度的一些信息（因为越拥挤意味着到达新均衡的运动越激烈，即潜在盈利的衰减速度越快）。想象一个研究员开发了一个根据华尔街分析师的建议交易股票的策略。越多分析师对某个公司持推荐意见，越会导致策略对此公司持有多头头寸，否则推荐建议的减少会导致对此公司持有空头头寸。这个策略很流行并被许多宽客（和主观交易者）所追随。然而，策略的效应是非常短暂的，对接收到信息的及时性非常敏感。

这个现象的一个例子如图9-4所示，使用2006年4~10月MSFT的数据。正如你所看到的，2006年4月28日有5次下跌，导致MSFT股票低于标准普尔500指数11.4%。事实上，在4月28日开盘时，MSFT的开盘价已经下跌大约11.1%，因为开市前对MSFT的降级已经发生。正因如此，量化交易者必须小心谨慎，不能允许仿真系统假设能尽早捕捉到11.1%的改变而进行交易。相反，要保守一些，应该测试评级发生后的几天开始交易的两周表现。

如果宽客确实这样做了，就会发现，在4月27日闭市（宣布评级改变之前的晚上）之后的任何时间卖出MSFT，收益实际上都相当平庸。如果在4月28日、5月1日（下一个交易日）或5月2日收盘价卖出MSFT，将会获得盈利。但是如果在5月3~12日进行交易，则不能盈利。这解释了策略对即时信息依赖程度的压力测试的重要性，这也不总是可利用的。

图9-4　阿尔法时间延迟策略的解释

有趣的是，延迟信号的实施并不总是导致坏结果。例如，标准普尔500指数策略倾向于“尽早”交易，也就是说，即使市场随后按照预测的方向运行，建立多头和空头头寸也为时过早。正因如此，延迟一天进入市场能够显著地将策略的总体收益率从746%（年化收益率为12.1%）提高到870%（年化收益率为12.9%）。对于这个策略的使用者而言，这必定不是好兆头。通常情况下，交易者不会很舒适地从交易策略中获得这样的信号，这个信号不仅使你延迟一会儿没有实施交易而无亏损（这可能是最好的结果），而且实际上，使你在获得信号至少一天之后再进行交易而盈利。

10.特定参数的敏感性

前面提到，通过改变参数，可能得到不同的结果。但是基于参数的微小变化对结果所造成影响的理解，有助于了解策略的质量。这里使用前面基于P/E的一个策略作为例子。我们认为任何P/E比值高于50或者为负值（因为负盈利）都应该被认为是昂贵的。同时，假定低于12的P/E比率是便宜的。按照前面讨论的度量方法检验这个策略，发现基于这些参数的低P/E策略（≥50表示昂贵，≤12表示便宜）获得10%的年化收益率和15%的年化波动率。

现在想象仅小幅改变参数，P/E比率低于11的股票被认为是便宜股票，高于49的股票被认为是昂贵股票。如果按照这个策略，与前面策略相比，结果则发生很大变化。我们应该对两个结果持怀疑态度，任何一个在模型中都不予采用。这是因为模型被证明对于参数值的微小改变过于敏感，在现实世界中没有什么使用价值。P/E值为10和11，或者P/E值为50和49之间应该明显不同吗？许多研究员所研究的是参数值的变化对结果变化程度的影响。参数的近邻集应该得到极为相似的结果，如果不是这样，研究员应该对策略持有怀疑的态度，因为这些结果可能意味着过度拟合（overfitting）。

过度拟合

前面描述了宽客判断既定模型好坏的一部分度量标准。这些标准在模型被创造以及使用的过程中，被用来判断模型的质量。的确，许多对冲基金投资者都会使用大部分这些度量指标衡量不同交易者的业绩。

然而，在判定量化策略的优度时，仍有一个极其重要的指导原则，这就是过度拟合。模型的过度拟合本质上意味着研究员使用过多的数据。最经典的定义是研究员建立了一个能够很好解释过去的模型，但对未来解释性较差。这可能发生于几种情况。

第一，研究员必须对模型的复杂度加以注意。模型的复杂度来自几个方面。一个是预测因子的数量。在建立模型时，研究员可以采用数千个因子解释资产价格过去的波动。模型或多或少能够精确解释过去发生的事情。但是让我们来回想量化交易模型的目的，类似于寻找阿尔法的交易者的目的，是预测未来，而不是解释过去。虽然我们期望过去对未来提供一些指导，但我们也必须理解过去最多是未来的不完美指南。而这意味着能够完美地解释过去，在预测未来时并不一定起作用。

第二，研究员由于条件的限制，创建相当复杂的模型。例如，可以设想一个为了判定持有多头或空头头寸而寻找价格行为的特定模式的策略。一个简单的模型可能要求：当金融产品的价格高于过去10天价格一定数量时，持有多头头寸。一个更复杂的模型可能要求，如果金融产品的价格在过去1天是下跌状态，在过去10天是上涨状态，在过去20天是下跌状态，在过去100天是上涨状态时，才开始持有多头头寸。当然，作为人类，我们擅长于理性地理解事物，我们可能能够对一些确定可以奏效的策略给出合理的解释。但是这确定比较复杂，因为里面包含许多“如果”语句。正因如此，策略是极其脆弱的。

在预测方面对相对简单模型的渴望以“节约”（parsimony）著称。“节约”来自拉丁语单词“parsimonia”，意思是“节俭”（sparingness）和“俭省”（frugality）。对于宽客，节约意味着做出假设时保持谨慎。在量化交易中，这处在研究过程的绝对中心位置。节约型模型使用较少的假设条件，尽可能简洁地解释未来。正因如此，对有许多参数或因子的模型通常要持怀疑的态度，尤其要考虑过度拟合的风险。

节约起源于方济会（Franciscan）的化缘修士和逻辑学家威廉·奥卡姆（William Occam）的一个著名准则——奥卡姆剃刀准则（Occam’s razor）。奥卡姆剃刀准则大概是由原始的拉丁语翻译得到，原始的拉丁语意思是：“如无必要，勿增实体”（Entities must not be multiplied beyond necessity）。在科学领域，这被理解为，使用尽可能少的假设条件，尽可能简单的理论解释事物。1992年，卡尔·波普尔指出，越简单的理论越好，因为它们极容易被检验，这意味着它们包含更多的经验值。在我们周围，科学家同意节约、去除不必要的假设条件和复杂度，则是更好的科学。本章最开始所引用的爱因斯坦的名言是另一条重要的警示，过于简单化的解释也是没有用处的。

回看顾问帮助你购买房屋的例子：如果他考虑增加大量的因素，比如客卫瓷砖的颜色或屋顶材料的类型，假定事前没有什么理由促使你成为他的顾客，他的分析将是混乱的。复杂模型（依据因子个数）可能能对过去有很好的解释，但不可能很好地预测你是否会喜欢以前没有见过的类型的房子，因为模型实际上不可能包括你所喜欢房子的全部因素。另一方面，如果顾问只考虑两个因素——房子的大小和学区，这个模型也不能很好地预测你的偏好，因为他留下了太多重要的变量，例如卧室的个数、卫生间个数、财产情况等。正是这样，量化研究员工作的一个重要部分是在尽力过于完美地解释过去和尽力简单地解释过去之间进行权衡。倾向于任何一边都是失败，因为这样模型会过于复杂化或过于简单化。

过度拟合的一个相关类型仅出现在交易极其不频繁的策略中。这里我们关心交易频率不高的情况，这些交易的统计量并不显著，并且不考虑交易是否盈利。例如，想象一个模型，在标准普尔500指数至少下跌40%以后的任何时间购买，当触及新高时再卖出。运行此策略，将会看到较强的回测结果。这个策略本应有巨大的盈利和相对较小的回测。在过去的40年里也确切地看到3个交易信号，但每13年出现一次交易信号着实很难令人感到兴奋。让任何资本承担这种策略带来的风险本身就具风险。

潜在的过度拟合风险的另一个常见来源是参数的具体说明。提醒一下，在第3章，我们讨论了许多模型有参数的事实。例如，在构建趋势模型时，研究员认为过去一段时间里价格变化的一些特征可能暗示着未来趋势的持续。可以想象，与这个模型相关的几个参数。例如，价格变化所处的历史阶段（量化领域中被称为回测，lookback）。这个时间段的最小长度是多少，被认为是很重要的因素。最小时间段长度是多长呢？这些问题不是模型的中心问题，然而不同的答案对模型所产生的收益率有重要的影响。例如，对于同一趋势模型（exact same trend model），回测两天的趋势产生的收益与回测过去6个月的趋势产生的收益会完全不相关。

宽客可以利用一些方法固定参数。基于市场先前的运行规律，一种方法是主观地设定参数。回测的结果预示着这个策略的效果如何。这个方法优点在于根本不用进行拟合。策略或者会起作用，或者不会。这个方法也有很多缺点。因为它严重依赖于研究员的判断，最优参数值可能与模型中设定的参数集相去甚远。也就是说，利用贝叶斯预测方法（在第3章进行讨论）的研究员可能倾向于以这种方式设置参数。

参数拟合的另一个方法是利用各种各样的参数值对策略进行回测，选择使得结果最优的参数。这个决定可以是主观决策，或者通过影响参数选择的算法进行判断。现在我们转向讨论一个参数值选择的例子，如图9-5所示。

图9-5　选取最优参数值

在图9-5中，你猜测哪个点是最优参数值？点A看上去不是最优，因为基于A点的参数值，策略表现较差。C点看上去较优，因为它是平稳阶段的最高点。但是C点距离悬崖边很近，我们不能确定是否处于不明智选择的风险之中。D点看上去最优，但是这一点也相当不可靠，因为邻近区域表现普遍较差。留下B点成为最优点。我们没有选择稳定阶段的最高点，而选择相对安全的参数值。为什么安全程度很重要，这是一个值得讨论的问题。

我们来看图9-5中唯一的峰值点D，检验揭露了在拟合阶段可能包含一些伪造点，这些点使得D的参数值对应的投资表现最优。遗憾的是，这个偶然结果也只是昙花一现。换句话说，如果选择D点，我们就在打赌认为未来会与过去完全相似。你可能熟悉标准的免责声明：“过去的表现不能代表未来亦是如此。”然而我们判断交易者是否成功时，至少部分依靠业绩，这也说明我们认为过去实际上可能是未来的一些暗示。同样地，通常情况下，基于科学研究的假设条件，所有的量化交易（确切地，包含科学）隐含地假设过去发生的事情有助于我们理解未来。这就是为什么科学的方法开始于对世界的观察，这些观察能够形成一种理论。但是思考过去最合适的方式是作为未来的一般性指引（general guide），而不是完全复制过去。我们建立的模型本身就是对未来的一般性指引的概括性描述，当以这种方式进行表述，很清楚我们宁愿模型更谨慎一些，不要犯错。正因如此，谨慎的宽客宁愿将点B作为更具鲁棒性的点，而不是D点，因为B点对应的投资策略更优的机会更多，而不是单纯地将样本数据的一些偶然情况作为最优结果。

参数拟合的最后一个注意点是参数或者只能适用于过去，或者随着市场数据的不断更新，参数能在未来重复使用。这里所考虑的情况适用于参数拟合的每一个实例。然而，重复拟合参数本身会增加模型的复杂性。而且，取决于重新拟合实施的过程，也可以使用尽可能少的数据进行拟合，以免出现过度拟合的现象。

这直接导致我们思考一个重要的话题：过度拟合，在第3章已略有提及。事实上，资本市场会产生大量的数据。类似文艺复兴科技公司都以每天收集太字节（TeraByte）数据而著称。仅捕捉每个美国股票交易所每天所产生的信息就超过1太字节的存储量。然而，数据是极为嘈杂的。资本市场为什么是一个噪声过程是哲学家和经济学家研究的内容。但是不可否认的是，过去的数据对未来波动的影响很小。这就是大量的样本外检验r2近似于0.04的原因（样本外检验是下个小节的内容）。很少的信号埋藏在那些噪声数据中。因此，对能够近似解释噪声过程的模型应该持有极度怀疑的态度。

量化研究员必须对正测试的理论进行评估。采用大量度量指标和技术可以完成这个工作。但是最终，还是依靠大量的主观判断进行评估。毫无疑问，正是对本章所提出问题的良好判断力可以将成功的研究员区分出来。一般情况下，我们可能注意到好的研究员必须拥有充足的信心和技能，相信理论能得以发展和改进。至少同样重要的是，研究员也必须具备足够的怀疑态度和拥有谦逊的品质，能够平静地接受大部分思想完全失效的事实。

样本外检验

样本外检验（out-of-sample testing）是检验流程中的第二部分，是告知研究员去除样本内检验中那些虚拟表格（cheat sheet）的帮助后，策略在实际中是否起作用。到目前为止，模型的参数已经通过样本内检验数据集而固定，问题是基于已被选择的参数，模型是否能在全新的样本外数据集中真正起到作用。本章描述的许多统计量可以被用来做出判断。

许多宽客使用的另一个统计量是样本外检验的R2与样本内检验的R2的比值。这个比率是度量模型鲁棒性的另一种方法。如果样本外检验的R2与样本内检验的R2相当接近（即，如果比率大于等于0.5），则被认为是一个好的模型。如果比值显著小，研究者必须对模型的成功应用持怀疑态度。

对于样本外检验有许多种方法。最简单的方法是使用除去样本内检验数据的剩下部分进行检验。一些研究员使用滚动样本外数据的方法（rolling out-of-sample technique），在这种方法中，最古老的数据点将会被丢弃，最新的数据点被用来拟合（样本内）和检验（样本外）模型。这个过程重复进行，直至全部可行的数据样本被完全使用。滚动样本外数据的方法被认为不断随着时间的改变而有助于更新模型，模型不是依靠可能先前运行了很多年的单一数据集。然而，这个方法依赖于环境，缺点在于模型不断地吸收最近一段时间的信息，这可能减少其鲁棒性。这种权衡是极其微妙的，在任何个例中都可能被争辩，只是对模型效果进行一般性的判断是不切实际的。另一种方法是可以使用不断增长的数据窗口，随着时间不断改变，更多的数据被收集，样本外检验将持续进行。

虽然样本外检验明显有效，但能够正确地操作是一件相当有技巧的事情。想象研究员基于样本内数据完成模型拟合。然后，研究员基于样本外数据检验看上去鲁棒的模型。但是这个模型在新的数据集上表现较差。在这个模型上已经投入大量时间的研究员决定检查模型在样本外数据集上失败的理由，发现模型在样本外数据集发生亏损交易，是因为环境发生改变。找出这些原因后，研究员返回到模型并修正模型以解释新信息。他重新在样本中拟合模型，基于样本外数据重新检验。模型运行得很好。

然而，我们在庆祝之前，应该考虑研究院所做的工作。通过研究样本外数据的信息，并使用这些信息重新训练模型，研究员有效地使用样本外数据，并使它们成为样本内数据集的一部分。通常情况下，在样本内数据和样本外数据之间来回切换是个可怕的想法。这会带来更加微妙的问题。

我们常常对资本市场发生的事情有足够的了解，我们倾向于建立模型、选择可能在样本外数据集起作用的参数集。这会扭曲样本外检验的目的，因为在很多方面我们期待未来的表现。例如，我们可以回望20世纪90年代后期的互联网泡沫，了解到，实际上世界经济没有发生改变，长远来看，那些业绩亏损的企业不会广泛地被社会肯定。如果现在建立一个策略，可以知道互联网泡沫会发生并最终破灭。然而，1999年，对此却不是那么确定。

新的有趣的事情会混淆我们的理解。正因如此，检验当前最好的想法优于过去已经存在的情况是一种痴心妄想。这是前视偏差的一种微妙和可恶的形式，是研究中的一个重要问题。当研究员对用来检验模型有效性的样本外数据集越来越熟悉时，很可能他们正暗中假设他们对未来会有很多了解，实际上，历史上询问同样的问题时，他们并不了解。这种情况被一些宽客称为加工数据（burning data）。

为了降低因加工数据带来的前视偏差，一些量化公司合理地采取大量措施，将策略研发功能从策略选择功能中分离出来，扣除研究员的一大部分数据。按照这种方式，理论上，研究员甚至不清楚有何种数据和没有何种数据，这样会减少犯前视偏差错误的机会。为了减少苛刻的限制条件，研究员可能不被允许知道或看见所被使用的样本外数据，或者样本内和样本外测试的数据比例可能随机被修改，或者不通知给研究员。无论如何，正如你极易看到的，检验中的问题是复杂的，如果想要有成功的希望，就必须要求有很多构思和考虑。

另一种方法是首先判定样本外检验是有点神秘的，尤其对于有经验的、善于观察的研究员而言。样本外检验被放弃，这是出于对样本内数据结果的额外警惕和拟合参数的最小化的综合考虑。在这个方法中，宽客尽可能使用较少的参数，将参数值设置在合理的水平，简单地测试策略，寻找有良好表现的参数。

检验中的假设条件

检验流程中的另一组成部分是假设条件，这些有关交易策略的假设条件在历史上已被检验。这里我们讨论两个例子：交易成本和（股票市场中性策略或多头/空头策略）空头头寸的可得性。

交易成本已经被研究过，包含佣金和手续费、滑点、市场冲击。有趣的是，在研究过程中，交易策略过去被实施实际上需要的成本并没有经验证据。这是因为，交易策略实际上并没有真实发生，而是目前基于历史数据正被研究。因此，研究员必须做出一些假设，假设订单因为市场冲击而造成的成本大小。

这些假设条件在确定策略好坏方面是很重要的。我们重新使用一个极端例子，来理解为什么会是这样。想象我们假设交易是完全无成本的情形。这可能使得非常高频的交易策略更具吸引力，因为，实际上只要预测到价格上的任何改变，无论是多小的改变，交易似乎都值得进行。想象一个模型在55%的时间里交易是正确的，当交易正确时，每股会获得0.01美元的收益。模型在45%的时间里是错误的，当交易错误时，每股会损失0.01美元。这样，每100股交易，期望收益是0.10美元。但是当这个模型被实施时，证明实际交易成本是平均每股0.01美元。这表明策略实际上在55%的时间里是收支平衡的，在45%的时间里每股亏损0.02美元。实际结果是，每100股不是盈利0.10美元，而是亏损0.90美元，这明显是一个较差的结果。一般而言，过高估计交易成本会使得宽客持有头寸时间长于可能的最佳值。然而低估交易成本将使得宽客太频繁地更换投资组合，产生额外的交易成本。如果我们在这方面不得不犯错的话，过高估计比过低估计更有意义，但能够近似正确估计成本仍是更受欢迎的事情。

在检验股票市场中性策略或多头/空头策略时，宽客做出的第二种假设条件与空头头寸的可得性（availability of short positions）相关。想象一个市场中性策略的量化交易员，根据策略设计，持有与多头头寸数量大约相等的空头头寸。随着时间的推移，通过发现价格被高估的股票，空头头寸规模会显著增加，在市场下跌时获取盈利，从而减少策略的内在风险。然而事实是，空头名单，尤其是最易成功的空头名单，在卖空限制（hard-to-borrow）列表中。卖空限制列表是那些通常被经纪商限制做空的股票，因为经纪商不能机械地借出股票。如果没有真实的股票被解除，这笔交易将被认为是裸卖空（naked short sale），这在美国是不合法的行为。因此，这项交易将不会像回测时预期的一样被执行。如果模型不了解卖空限制政策（模型要警惕过去发生的这些问题并不是一件小事，因为这些历史数据很难获得），研究员很容易愚蠢地认为空头组合将能够带来价值，而现实中并不可能存在。这是因为当他真正进行投资组合时，才会发现不能进行最优的空头交易，被迫使用较差的空头交易代替。