Local EPUB Text
正态分布
未知
正态分布
正态分布在日常生活中频繁出现。例如,一个国家或地区全部人口的身高、体重情况都很好地符合正态分布。实际上,很多由一连串随机事件构成的变量都会呈现出正态分布的形态,例如在连续生产中用于向标准容器中灌1加仑(1加仑=3.78立方米)液体的机器每次的灌装误差。同样的逻辑,如果投资者对收益的期望是理性预期,那么实际收益率应该是服从以此期望为均值的正态分布。
正态分布为什么是“正态”的呢?假设一个报社在生意好的一天赚100美元,生意不好则不赚不赔,且两种情况发生的概率各为50%。因此,它平均每天的收益是50美元。我们可以据此画一个二叉树来描述所有可能发生的状况,下面的事件树(event tree)展示了两天生意可能发生的情况。
注意到,两天会产生3种不同的结果,而总的来说,n天会产生n+1种情况。在上图情况下,最有可能发生的是生意一天好、一天坏,概率为0.5,两种极端情况发生的概率各为0.25。
那么在很多天生意之后利润情况会是怎样呢?比如200天之后,可能性达到201种,但是最可能发生的还是位于正中间的结果,而且抵达这种结果的路径多了很多。比如,只有一条路径能形成连续200天惨淡生意的结果,然而100天生意兴隆、100天生意惨淡的结果却有很多种排列的可能性。随着天数的增多,这样的概率分布最终会形成大家熟悉的钟形形状。[1]
图1-4展示的是一个均值为10%、标准差为20%的正态分布。这个图形展示了在给定这些参数下各种收益水平发生的理论概率。较小的标准差意味着可能的收益表现更多地聚集在均值附近,较大的标准差则意味着可能实现的收益水平更加分散。任何一个特定收益率实现的概率都由均值和标准差来决定,换句话说,一个正态分布的形态完全由其均值和标准差这两个参数来决定。
图1-4 正态分布(均值10%,标准差20%)
如果收益率的分布可以用正态分布来近似拟合的话,投资管理将变得更加有理有据。第一,正态分布是左右对称的,也就是说,均值左右程度一样的偏离其发生的概率也一样。没有对称性的话,用收益的标准差来衡量风险显然是不合适的。第二,正态分布具有稳定性,意味着对于具有正态性的不同资产,其构成组合的收益同样服从正态分布。第三,当资产或资产组合收益分布只有两个变量时,对其未来的情境分析因为需要考虑的变量很少而会变得简单许多。第四,当构造证券组合时,我们必须考虑证券收益的相关性。总体来说,这种相关性是多层面的。但是如果收益是正态分布,收益之间统计相关性可以以相关系数来表达。这样我们在描述任何两个证券的相关性时只需估计一个参数。
实际的收益分布需要与正态分布相似到什么程度时我们才可以使用正态分布代替收益的实际分布呢?显而易见,收益的分布是无法用正态分布完美代替的。比如,与正态分布不同的是,实际收益率并不会低于-100%,但这并不是说正态分布就一无是处。在其他环境中类似的问题同样存在。比如,一个新生儿的体重会去跟所有新生儿体重的分布做对比,而显然新生儿的体重并不存在零或负值。但是在这种情况下,仍然使用正态分布来表示新生儿群体的体重分布情况,因为体重的标准差和体重的均值相比起来较小,问题中出现负值的概率基本可以忽略不计(注:实际上,均值为3958克,标准差为511克。一个负的体重的概率要在离均值7.74个标准差以外,在正态分布的假设下,这一情况发生的概率为4.97×10-15,于是负的出生体重在实际研究中可以不用考虑。)。所以,类似地,我们必须给出一定的标准来决定收益率的正态假设的合理性。
【例1-10】 Excel中的正态分布函数
假定标准普尔500的月收益率近似符合均值为1%、标准差为6%的正态分布。那么在任何一个月指数收益为负的概率是多少?使用Excel建立一个函数能很快解决这个问题。在正态分布函数中观察的结果小于临界值的概率用NORMDIST(临界值,均值,标准差,TRUE)得到。在这个例子中想得到小于零的概率,即计算NORMDIST(0,1,6,TRUE)=0.4338,也可以在Excel中建立标准的正态函数来求均值低于1/6个标准差的概率:NORMDIST(-1/6)=0.4338。
[1] 历史上,早期18世纪对正态分布的描述基于很多期“二叉树”的结果,如同我们之前分析的一样。这一表达在实际中多用于期权定价。