Local EPUB Text
1961年
长期投资、对数效用、再平衡、达尔文生存
马科维茨(1952年3月)关注的是单期情况下投资者应采取的行为。布雷曼(1961)则问道:一个“长期”的投资者在面临多次的相同赌博,可以将利润再投资的情况下他应该怎样做?他的最优赌博策略是否与单次赌博策略相同?他在开篇这样写道:
假设我们冷心肠且不道德地对待一位拥有无尽财富的朋友。我们诱使他参加一场抛掷钱币的赌博,在这场赌博中正面出现的概率会高些,这对我们是有利的。换言之,在每一抛掷中我们都有概率p的情况使赌注翻倍,而p>1/2。如果我们既聪明又寡廉鲜耻,那么我们很快就开始担心每一次应该投注多少。如果在每一次投注中都把我们的所有财富押上,那么几乎肯定会导致破产。另一方面,如果我们每次投入财富中很少且等额比例的资产,那么大数法则会告诉我们的财富会趋向于无穷大。我们应该怎么做? 14
布雷曼的答案是:在每一次投注中都选择我们财富的一定比例进行投注,这个比例能使我们财富的预期对数效用在投注后最大化。他之所以这样建议是因为对数策略具有几项魅力特征:①与其他任何不同的策略相比,对数策略从长期来看几乎肯定会带来更多的财富;②对数策略决不会毁于风险;③在达到预先设定好的财富目标的过程中,使用对数策略会渐进地降低所需的预期时间。事实上,这些特征是如此吸引人从而使得有人提出:对任何追求预期财富效用最大化的人来说,对数策略都是最佳的长期策略。不过,莫森(1968)指出这种推断是不正确的。
早些时候,亨利·阿伦·拉塔尼就提出要使预期对数效用最大化,这是因为它有助于资本增长。 [34]他的研究最早出现于1956年,与小J.L.凯利的研究结果相似,且他们是同时独立完成研究的。 [35]
马克·鲁宾斯坦1991年推出与布雷曼类似的结果,但是假设赌博的收益是对数正态的。 [36]这能使推演过程简单,而且在给定赌博的均值与方差以及替代的无风险选择的情况下能得到精准的结果。这篇文章关注的投资策略特性是:连续地在无风险证券与风险证券之间进行再平衡直至风险证券达到固定的比例(α≥0)。假设X和Y是时间发生t之后两项不同(α值不同)再平衡策略的价值。由于风险证券是对数正态的,那么X和Y在连续再平衡中也是对数正态的。那么第一项策略优于第二项策略的概率就如下公式所示:
其中,x≡lnX,y≡lnY,μ x≡E(x),μ y≡E(Y),σ 2x≡Var(x),σ 2y≡Var(y),ρ≡Cor(x,y)。
对prob(X>Y)的证明
令z≡x-y:
prob(X>Y)=prob(lnX>lnY)=prob(x>y)=prob(x-y>0)=prob(z>0)
由于X和Y是对数正态分布的,x和y是正态分布,那么z一定也是正态分布,参数如下:
由于prob(z>0)=prob[(z-μ z)/σ z>-μ z/σ z]且(z-μ z)/σ z是个标准的正态分布变量,那么:
融合在一起,则有:
可以很容易看出,如果X是选择α来使对数效用最大化的结果,Y是其他策略的结果,prob(X>Y)>1/2。因此,对于任何期间t,对数效用策略都会优于其他策略。由于μ x=E(lnX),如果选择α使这个数值最大化,那么对于不同策略得出的结果Y,这项选择就要使μ x-μ y的差值最大化。反过来,就要使prob(X>Y)最大化并确保它>1/2。而且,随着t趋向于无穷大, 会趋向于无穷大,从而使prob(X>Y)这个概率将趋近于1。因此,我们可以说在足够长的时间里可以保证对数效用策略几乎优于其他所有策略。而且,达到预先设定目标收益a的时间,使用对数策略也是最少的并等于(lna)/μ,其中μ表示对数策略每年的预期对数收益。
达到目标收益的预期时间公式
令a>1是目标收益(例如,如果a=2,那么意味着你的目标是使最初的筹码翻倍)。达到目标收益的预期时间E(t)等于:
积分从t=0到t=∞,因此使μ最大化的策略也就使E(t)最小化。
但是,在美国的股票市场中使用对数策略到底要花多长时间才能达到预定目标?使用美国的数据来计算你会发现:在债券投资上使用对数策略需要花费208年才能保证有95%的概率获得高于100%的回报率;而在股票投资上则需要4700年才能保证有95%的概率获得高于100%的回报率。因此,尽管在理论上长期投资中使用对数策略很吸引人,但是在实践中要达到目标可能真的需要很长时间。
汉斯和维纳·斯坦是对数效用的忠实捍卫者。 [37]斯坦模仿查尔斯·达尔文(1809年2月12日—1882年4月19日)1872年名著《物种起源》的思想提出,替代效用的形成是无意识的生存竞争的自然结果:
演进的真正偏好是优胜劣汰,但是为了有效地引导我们的行为,自然界已经用很多替代偏好或工具偏好来代替它了,这种情况经常发生且没有给我们显示任何蛛丝马迹。我们喜欢在远足后休息这是因为我们感觉累,而不是为了帮助我们的身体保持化学与物理平衡。我们避免痛苦是因为它对我们有伤害,而不是我们有意识地想避免对我们肌肉、肌腱、器官或关节的损伤。我们想吃是因为我们感觉到饥饿,而不是为了储备能量;我们喝水是因为我们感觉到渴,而不是因为我们知道我们的血液已经过于黏稠。我们喜欢温暖是因为我们感到寒冷,而不是因为我们知道体温必须保持在37摄氏度。当我们发现令人心仪的异性时,我们有性冲动是因为我们有这种感觉,而不是因为我们想复制基因。在所有这些情况下,我们都寻求方法来满足我们的表象偏好,基本目的是维持我们的生理舒适和确保生产,而并不知道我们真正的意图是什么。(p.4) 15
首先,斯坦假设人类拥有的是字典排序式的偏好,因为人类将生存排在所有关注项的第一位。然后,他将财富等同于生存与子孙的数量,并认为偏好一定是人类不愿意冒没有财富的风险。其次,他认为偏好会根据“选择性质量”的特性来演进,即有助于从长期来看能带来高数量偏好。最后,演进的偏好也具有“选择性优势”,将导致演进路径上的规模要比其他无穷大。斯坦的结论是:尽管自然可能尝试了许多种决策法则来管理财富,但是一旦发现了财富预期对数效用最大化的法则就将其他法则排除在外,这是因为对数策略在选择性质量与选择性优势上都优于其他法则。