Local EPUB Text
大脑与不确定性(二):神经经济学
定义目标
玛尔曾经指出:“通过搞清楚需要解决问题的本质来理解一种算法,比通过研究使该问题被体现的机制(及硬件)更为快捷。”而进化论提供了这样一个模式,它指出所有行为的最终目标只有一个——最大化生物体的内在适应度。
在整体意义上,可以认为神经系统的功能就是依托进化适应度进行决策。即便是笛卡儿提出的反射,也可以被看作是神经系统在面对一个很简单的、为生物体确定一个明确目标的问题时作出的决策。
你打过台球吗?这类游戏是确定性数学的经典例子。因为我们假设白球处于具有可预知性的牛顿体系之中,并且我们具有关于那个世界状况的完全的知识。在这些约束下,我们就可以用简单的确定性方程计算出最佳的运动反应。但是,这可能不是神经系统必须面对的具有典型性的决策。
设想白色的台球对周围世界仅具有有限的知识,而且只能看见球桌上距离自己一尺范围内的色球。这样的话,知识的不完备会使确立最佳反应更加困难。在存在较大不确定性的任何领域,不管确定性工具是多么先进,它们都不可能确定出最优反应。
如果对确定性世界具备完全知识,那么要明确计算目标就相当容易,但真实的情况是我们对现实世界的状态很难完全了解。所以选择某种运动反应(作出决策),从而最大化不确定条件下的适应度就成了神经系统所面临的真正挑战。
台球世界中认识论的不确定性
这一问题要求数学家和生物学家发明一些工具,从而可以用来设计不确定问题的解决方案。
概率论的诞生
掷一个共有6个面的骰子,虽然我们事先并不知道骰子落地后哪一面会朝上,但是却知道2点朝上的概率为1/6。不过,在启蒙运动之前这并不是一个人尽皆知的道理。虽然早在古代,人们就开始玩掷骰子以及其他靠运气定胜负的比赛了,但直到17世纪,不管是数学家还是平民百姓,都不知道如何正式地描述、量化或预测不确定性事件。
概率论这一数学分支学科首先被一名年轻的数学家(他还是物理学家、哲学家和散文家)发展起来,这个人就是布莱兹·帕斯卡(BlaisePascal,1623年6月19日—1662年8月19日)。
布莱兹·帕斯卡
帕斯卡生于法国克莱蒙费朗,3岁丧母。他的父亲艾基纳·帕斯卡是一名小贵族和当地法官,对科学和数学具有很大的兴趣。帕斯卡青年时期展现了杰出的数学才能,16岁就发表了一篇关于圆锥截面的论文。在25岁前,他已经开始着手对解决不确定事件的数学方法进行研究了。
1653年9月,帕斯卡受邀与几位绅士结伴旅行,他们分别是罗尼兹公爵(帕斯卡的资助人)、梅雷爵士和明顿绅士。旅途中,梅雷爵士向帕斯卡提出了一个赌博难题,即所谓的“赌金分配问题”。这一问题说的是,两个人采用连续掷硬币的方式来赌博,每个人的赌资是50个金路易。如果首先有4次硬币正面朝上,则梅雷爵士赢得全部赌注100个金路易;如果首先有4次反面朝上,则罗尼兹公爵赢得全部赌注100个金路易。但是连续抛5次硬币之后游戏突然被中断了,此时出现了2次反面,3次正面。也就是说差一次正面梅雷爵士就将获胜,而罗尼兹公爵再有2次反面也将获胜,那么此时应该怎样分配这100个金路易。
现在,这个问题看起来真是简单至极:接下来抛硬币时会出现两种可能性相等的结果:正面朝上,则梅雷爵士获胜;反面朝上,则是平局,必须再抛一次。此时每个参与者获胜的可能性相等。总的来看,梅雷爵士有75%的机会获胜,而罗尼兹公爵为25%,所以他们应该按75/25这一比例分配赌金。虽然这种逻辑显而易见,但是对于梅雷爵士和他的朋友来说,这一逻辑在那时是不可知的,甚至是不可想象的。
帕斯卡对这个问题似乎很着迷。他希望不但可以解决这个问题,而且要发展一种基于经典几何学的数学方法来解决与这一问题相类似的一般形式的问题。
帕斯卡的研究方法与现代的方法有所不同,因为当时还没有“概率”这个概念,而只有“机会”这样的说法。于是,他把所有事件全部简化成一套确定的结果或者均等的机会。在此基础上,帕斯卡推出了一组公式,这组公式可以描述等概率事件是怎样进行组合,从而产生不均等的复合概率。正是概率既可以组合又可以比较这个观念使得西方思想界发生了根本的变革。
帕斯卡有着深刻的洞察力。他认为对概率论的理解不仅仅会影响到数学的教学和风险的计算,而且必定会影响到从神学到人类决策的所有事情。概率论必将对人类决策产生影响,这一认识大概是帕斯卡的最大贡献了。
在帕斯卡去世后才出版的(1670年)著作《沉思录》中,他提出了现在被称为“上帝存在性”的帕斯卡赌注:
“上帝或者存在,或者不存在。”我们会倾向哪一个呢?那些(基于确定性数学工具的)逻辑推断不可能解决这一问题……旋转的硬币究竟会倒向正面还是反面呢?你赌哪个?那些(基于确定性方法的)逻辑推断不可能作出选择,也不可能进行证伪……
但是你必须赌,必须作出决定,别无选择。那么你会选哪个呢?我们来看看,既然必须作出选择,那么看看哪个给你的利益最小……这个游戏中,如果正面表示上帝存在,我们可以衡量一下得失。我们可以对以下这两种情况评估一下:赢则全得,而输却无所失,那么不要犹豫,赌上帝存在。
“但是如果(要放弃一生的罪过),这样的话我也许赌得太大了。”我们可以想想,因为得失机会相等,如果你拿地球上缺乏道德规范的一生去赌具有上帝赐福的两辈子,那么你就可以一搏(即使你并不确定怎样选择),但是如果你赢得是上帝赐福的三辈子呢?……如果你迫于无奈必须选择,在得失相等的游戏中你不冒生命危险去赌上帝赐福的三辈子是不明智的。但那毕竟有来世的生命和幸福,如果真是这样的话,即使机会无限,只要其中有一个使你受益,那么赌一次仍然是正确的选择……因此在得失机会相等的游戏中,如果赌注(或可能的损失)是有限的但所获得的奖励是无限的时,我们的论据就具有无限的分量。
帕斯卡的思想在整个欧洲产生了巨大的影响。他的朋友及其周围的人意识到,比起微积分的发明,帕斯卡在不确定性或随机世界所做的事情毫不逊色。帕斯卡试图弄明白怎样将对得失的估计与对未来事件的可能性的估计结合起来,从而确定何种行为方案可以产生最优结果。
帕斯卡的朋友安托万·阿尔诺说:“我们从中得到的主要收获是:它们可以使我们更加理性地看待希望与恐惧。”
将价值同概率结合起来
20世纪前半叶,概率论成为估计具有不确定结果的未来事件可能性的工具。由于它赋予了未来事件的可能性以数字形式表达的值,所以对于解决如何选择不确定条件下的最优结果这一问题,概率论取得了巨大的成功。
在此基础上,帕斯卡和阿尔诺又进行了进一步的研究。他们开始将关于事件可能性的信息同该事件对选择者的价值结合起来思考。帕斯卡完成这一结合的公式很简单:把某事件的概率同用货币(比如金路易)表示的该事件的价值相乘,通过这种方法求出预期值。于是,最优化决策就可以简化成这样一种能够确立可产生最大预期值的行动方案的技巧。
需要注意的是,这种方法仅仅是核心发现之一,它并不是现代经济理论建立的基础。随着预期价值理论被广泛应用和理解,瑞士数学家约翰·伯努利的儿子尼古拉斯·伯努利首次对从这一理论推出的奇怪悖论进行论述。这就是上文介绍过的圣彼得堡悖论。
18世纪早期,这个被人们所了解的圣彼得堡悖论成了概率论研究中的一大热点。直到1738年,这一悖论才被尼古拉斯的弟弟丹尼尔·伯努利解决。
丹尼尔认为预期价值理论这种观点向人们提出了不合理的要求,它暗含地假定人们对风险无动于衷。让我们来考虑一种典型情况。想象一下,现在你饥饿难耐,而且此时已经很晚了,如果现在你有两种机会可以选择:一种是100%的可能性赢得50个土豆条;另一种是有50%的可能性赢得100个土豆条。面对这两种情况,大多数人一定会选择肯定赢得50个土豆条的机会,而不愿冒险以至于一无所获,继续流浪。我们可以通过增加获胜概率为50%的抽奖法的支付,直到人们发现两种抽奖对他们来说具有相同的吸引力,从而评价人们对风险的厌恶程度。100%的机会得到50个土豆条与50%的机会得到多少个土豆条具有相同的吸引力呢?150个?200个?还是400个?通常大多数人表示,比起肯定可得50个土豆条的那个游戏,他们稍稍偏爱于有50%可能性得到200个土豆条的那个游戏。正如伯努利所提出的,在心理上200个土豆条的价值大概相当于50个土豆条的两倍。
现在让我们作进一步探讨:减少这两个抽彩给奖法的支付价值。在100%可得到5个土豆条和50%可得20个或者15个或者12个土豆条的这些抽彩给奖法中,你会选择哪个?对于50%可得12个土豆条的赌局和100%可得5个土豆条的赌局,几乎所有人都一样中意。虽然在心理上200个土豆条的价值只是50个土豆条价值的两倍,但是12个土豆条的心理价值却是5个土豆条心理价值的两倍。伯努利指出了这点,并得到结论:任意所得在心理上价值的增长速度慢于数学上价值的增长速度。
与丹尼尔·伯努利同时代的德国生理心理学家韦伯也通过研究发现这一现象:人们感受到的差别的不同量之间的绝对差并不是恒定的。他以感知重量为例,人们能分辨出10克与11克之间的差别,但是却分辨不出1000克与1001克之间存在着的差别。
另外,丹尼尔还发现:比起那些一无所有的人,富人(在上面这个例子中指那些拥有几袋土豆条的人)更愿意冒险。
对于丹尼尔来说,这些观察结论都显示了这样一个道理,即所得的心理价值同所得的数学价值是两个不相同但又相互联系的概念。他指出人们在作决策时,总是先估计那部分价值使自己当前状况改善的机会有多大,而不是这部分的绝对价值。在此基础上丹尼尔创造了一种将价值与效用联系起来的简单形式,利用二维平面图就可以表示两者之间的关系(参见图2-2边际效用递减)。这就是效用理论。
概率论的进步
18世纪中期之前,概率论(显著地不同于评价理论——如预期效用理论)几乎全部集中于对诸如赌博、投硬币、预期寿命等这些具有不确定性的未来事件可能性的估计上。这类可能性估计常被称为“偶然概率”。
准确地说,偶然不确定性事件指一种可能性事件,帕斯卡曾预言它将成为“概率论的算法”的研究主题。不管世界是否真正具有确定性(就像笛卡儿和伽利略所希望的那样),我们通常不知道将来会发生什么。
但是,有两个人意识到,概率论不仅可以用来估计未来事件的可能性,而且还可以对过去事件的可能性进行估计。虽然这一点看似微不足道,但是却改变了欧洲人对概率数学的思考方式,同时也为更加正式的决策理论开创了新局面。这两个人是英国牧师托马斯·贝叶斯和法国数学家皮埃尔·西蒙·拉普拉斯。
托马斯·贝叶斯
当时一位天文学家短时间内连续6次对木星的地平纬度进行测量,从而得到6个不同的值。木星有唯一的地平纬度,但是我们却得到了6个并不完全准确的值,且各不相同。我们可能要问,哪个才最有可能是木星的真实地平纬度呢?正是由于托马斯·贝叶斯(Thomas Bayes,约1702—1761年4月17日)的发现(在他去世后于1763年成书出版)才使得概率论能够回答这类问题。
贝叶斯认为,如果知道了由天文学家的仪器所引起的误差的分布,那么就可以在数学上推出最有可能的木星的真实海拔值了。有一点需要指出的是,这类概率不存在任何偶然的成分。因此在进行测量时,木星肯定有一个真实的海拔值。不确定性仅仅源于我们知识的不足。在这个例子中,我们所面临的限制全部都是认识论上的。此外,贝叶斯还指出,概率论不仅可以用来描述偶然的不确定事件,还可以用以描述认识论上的不确定事件。
贝叶斯的见识相当深邃。他意识到,我们对很多事情仅具备不完全或不准确的知识,所以尽管有些事情真的发生了,但是由于我们知识的有限性,使得它们仍然具有不确定性。
贝叶斯定理为解决这类认识论上不确定性的基本统计方法奠定了基础。贝叶斯定理通过下面的方法做到了这一点:在给定某人有效的观测结果的情况下,它将对世界所有可能的过去状态的概率预测过程置于严格的数学基础之上。
人们对贝叶斯的生平知之甚少,只知道他是一位生活在乡下的新教神学家。他生前只有两部著作:一本是神学著作《神的善行》;另一本是数学著作《流动学导论——数学家针对分析学家异议的辩护》。贝叶斯去世之后,他的朋友,也是他遗嘱的执行者理查德·普莱斯在其论文中发现了一篇名为《论如何利用或然性理论解决问题》的手稿。普莱斯于1763年将这份手稿交给了皇家学会,凭借这份手稿,贝叶斯获得了巨大的声誉。
虽然贝叶斯已经得到了一种可以对过去事件的可能性进行计算的最佳方法,但是拉普拉斯对此并不知情,他在1772年开始对逆概率产生兴趣。他在对天体力学孜孜以求的同时,也对现代概率论的发展作出了很多贡献。
拉普拉斯认为,未来的不确定性并不存在根本的偶然性,存在的只是对过去和未来在认识论上或多或少的不确定性。从这一基础出发,他也尝试建立一个最优的估计过去和未来事件可能性的体系。
正是由于贝叶斯和拉普拉斯,现代概率论和决策理论才得以诞生。
概率、价值、决策和进化
从进化论的角度讲,神经系统的目的必然是为了作出能够最大化生物体内在适应度的决策。如果我们知道运动反应与内在适应度是怎样联系的话,那么为了确定最佳运动反应,把感觉信息与已知的环境结构现状结合起来的最佳方法是什么呢?
帕斯卡、伯努利、贝叶斯和拉普拉斯等人从现代经济学理论的角度回答了这个问题。从进化论的角度来讲,要明确这一目标需要计算生物体的每个可能的行动方案的效用值。然后利用贝叶斯定理对每个结果的概率进行估计。把这些数据点组合起来,就可以确定任何既定情况下的最优运动反应了。
从20世纪50年代开始,行为生态学家就试图建立描述最优行为策略的量化模型去理解动物为什么按照我们观察到的方式采取行动(例如,动物为什么会选择一种食物而非其他,为什么选择这个配偶而不是另一个)。
他们认识到,在不确定的世界中,有效的解决办法只能通过概率理论来描述。因此这些科学家把经济学工具作为工作的起点,以经济学为基础的理论在行为生态学的研究中随处可见。
古典经济学与行为生物学融合的思想方式最早出现在1966年同时出版的两份里程碑式的报告里:麦克阿瑟和皮安卡的《关于混杂环境的最优利用》和艾姆伦的《时间和能量对食物偏好的影响》。艾姆伦在他的报告里指出:
我们可以假定,在特定物种肉体和神经的限制范围内,自然选择将通过影响的方向和强度促进能够最大化每个个体在单位时间里卡路里摄入量的进食偏好的发展(不管以哪种方式——先天的或者是后天形成的)。
在这个思想的基础上,华盛顿大学的艾里克·恰尔诺夫和戈登·奥里安通过对动物收集食物过程的观察得出这样的结论:所有觅食动物的目标,都是有效地收集食物。这就意味着,原则上所有动物都必须以尽可能少的能量支出收集尽可能多的食物,并且建立了一个“捕食模型”。
在恰尔诺夫的概念中,觅食过程就是这样一个循环:搜寻、遇见、决定、搜寻、遇见、决定……捕食模型的目的就是描述作出决策的过程:决定吃这个猎物还是继续搜寻其他猎物。恰尔诺夫认为,为了有效地作出这个决定,觅食者必须了解关于每个潜在猎物的四个方面的信息:
1.吃掉这种动物的一个典型个体所能获得的能量。对于狮子来说,这相当于知道一头水牛的肉是疣猪的20倍。
2.捕获和消费这种类型的猎物需要花费的平均时间,也就是处理时间。对于狮子来说,则是从捕捉猎物到吃掉猎物这段时间。
3.处理过程中消耗掉的能量成本。显然,比起捕食一只疣猪,狮子捕食一头水牛所消耗的能量肯定要多很多。
4.每天发现各种类型的猎物的概率。
通过系列计算,恰尔诺夫得到了度量某一组给定的攻击策略在单位时间内可获得多少能量的标准:
得益于微积分的发明,这些数学生物学家可以把事情做得更漂亮一些:他们能够直接计算出哪种具体的攻击策略可以使能量摄取率最大化。在对以上等式作一下微分处理后,就可以得出一个新的等式,然后用它来计算出能够最大化R 值的捕食策略。
在得到了一个新的经过微分处理的等式后,一个有趣的并且出人意料的观察结果就出现了。为了能够最大化能量摄取率R ,一种特定猎物被攻击的概率应该是1或者0,即觅食者要么总是攻击这种特定类型的猎物,要么从来不攻击这种特定类型的猎物,这个观察结果被称为0—1规则。在任何情况下觅食者都不会出现有时攻击有时不攻击某种类型猎物的情况。
那么,觅食者应该攻击哪些类型的猎物呢?模型表明,如果捕食这种猎物所获得的能量除以处理时间(即捕食这种猎物的净能量获得率),小于遇见其他猎物的概率乘以从其他猎物中所获得的能量摄取率,那么就绝对不应该攻击这种猎物。也就是说,只有当攻击这种猎物的价值高于搜寻其他更好的猎物的价值时,觅食动物才会攻击这种类型的猎物。
捕食模型需要实验的检验。恰尔诺夫和他的同事设计了一个用山雀为实验对象的捕食实验。
在一个人为的觅食环境中,给山雀两种价值已知的猎物类型:大幼虫和小幼虫,大幼虫是小幼虫价值的两倍。猎物由一个传送带移动到山雀所在的笼子内,笼子内的山雀并没有看见猎物放置的过程。
按照0—1规则,动物认为某个类型的猎物值得吃,就总会吃它;如果认为不值得吃,就永远不会吃它。但是,令人惊讶的是这与实验者观察到的结果不符。虽然这些山雀具有选择性,但是所吃的幼虫中只有约85%是大幼虫,而不是理论上预计的100%。显然,山雀没有按最优策略来择食,而是采用一种次优策略。
不过,如果我们换个角度来思考,山雀的行动可能是最优的,而数学模型则可能存在一些错误。在现实世界里,猎物的价值是会改变的,而山雀的神经系统也会认识到这个事实。因此这些山雀会不时地挑选小幼虫,假如将检验捕食模型的实验环境扩展为整个全球环境,这将是最优的策略。
不可简约的不确定性
除了我们认知局限导致的不确定性外,还存在另一种事实存在的不确定性。
我们再次借助台球桌案例。这一次,考虑一个与我们生活世界相像的台球桌世界。假设台球桌上随机放着一个充满智慧的白球,并假设该白球的视野是有限的(白球在认识上具有不确定性),再假设除了白球以外的其他球都有自己确定的位置,而且其他的色球和白球一样拥有智慧,它们并非是被动的环境因素,而是和白球一样,目标也是将桌面上其他的球清理干净,在这个意义上,它们都是相互的竞争者。
如果一个黑球位于球袋的前面,并且出现在白球的视野中,白球经过详细数学分析得出结论:最优策略是尽快将黑球击入球袋。同时,黑球也知道了白球的想法。那么,面对这种情况,黑球该如何取胜呢?
只要黑球采取了确定的策略,无论多么复杂,白球都能够(至少理论上如此)推断出这个策略,并采取相应的策略击败黑球。黑球只有一个策略,它的行为必须不可预测。如果黑球前进的方向是不确定的,那么白球就不一定能够击中它。只有增加一种随机因素,给对手一种无法消除的不确定性,才是黑球对它的竞争者采取的最优策略。
对这种(通过行为随机性引入的)不确定性的认识对理解行为、大脑和意识之间的关系极为重要。
博弈论
古典经济学理论从未考虑过面对智能型对手时的决策制定。当面对一个智能型对手时,我们不仅受到来自静止世界的影响,还受到来自竞争者所采取的行动的影响。这是由于在一场真正的两人竞争中,你和对手的行为组成了一个动态系统。我们不可能用古典经济学方法来理解这种动态系统及其包含的不可简约的不确定性。
20世纪40年代,普林斯顿的数学家约翰·冯·诺依曼和经济学家奥斯卡·摩根斯坦对古典经济学的这种局限性产生了兴趣。他们将发生在智能型竞争者之间的相互作用叫作“博弈”。
引起冯·诺依曼和摩根斯坦特别兴趣的是一类名叫“混合策略零和非合作博弈”的数学博弈。博弈论建立的基础正是非合作博弈,这主要是由于零和概念的简单性。
在零和游戏中,一个选手的获益总是严格等于另一个选手的损失,在任何可能的结果中,选手总的损失和获益为零。在选手之间的这种完美对称性简化了很多博弈论所涉及的复杂数学问题。
冯·诺依曼和摩根斯坦的研究一直专注于寻找零和博弈的最优解。但是到了20世纪40年代晚期,人们逐渐认清了这种做法存在很大的局限性。在多种博弈中,一个博弈者的获益在数值上并不等于另一个选手的损失。这些非零和博弈,尤其是那些包含混合策略的博弈,是非常难以解决的。
为了理解这些博弈如此重要的原因,以及为什么它们需要一种特殊的解法,让我们来考虑一下大家都很熟悉的斗鸡博弈。史密斯和琼斯分别坐在桥两边的车中,收到信号后,他们以最快的速度相向行驶。当两辆车就要相撞时,史密斯和琼斯都要决定是继续行驶还是改变方向。假设斗鸡游戏的策略形式如表3-3。
表3-3 斗鸡博弈
史密斯继续行驶 史密斯改变方向
琼斯继续行驶 -100,-100 50,-10
琼斯改变方向 -10,50 1,1
如果史密斯和琼斯都没有改变方向,那么他们的车子都会被撞烂——根据冯·诺依曼的方法,我们给两个选手的损失赋值为-100。如果其中一个人选择转向,那么我们将转向者的损失表示为-10,而另一个人则有50的收益。最后,如果两个选手都转向,我们则认为出现了平局,两个人都没有获益。
那么,我们应该如何理解这个博弈呢?在理想状态下,我们想要知道史密斯和琼斯的最优策略,但是由于这个问题不是零和问题,那么冯·诺依曼的公式对于我们来说几乎没什么帮助。如果两人都选择继续行驶,那么他们都会遭受明显的损失;如果一个人选择转向,那么另一个人的收益远远高于转向者。因此,这个博弈中并不存在收益和损失的零和状态。
20世纪40年代后期,约翰·纳什(John Forbes Nash Jr.,1928年6月13日— )是普林斯顿大学数学系的研究生,当时这里是第二次世界大战后数学界的中心。当纳什渐渐成为20世纪最伟大的数学家之一时,爱因斯坦和冯·诺依曼都早已成名。纳什寻找博士论文题目的时候,发现了非零和博弈的一个有趣的结构。让我们从纳什的角度观察斗鸡博弈,以便了解他是如何使用预期效用概念和均衡理论来克服冯·诺依曼的局限性的。
纳什发现,如果琼斯和史密斯一次又一次地进行斗鸡博弈(为了进行数学分析,忽略他们死去的可能性),那么两个人的行动必然会达到某种均衡。在这个均衡点上,两个人的得失相等,并且两个人都没有变化的动机。
通过数学计算,纳什得出史密斯转向的概率是64.7%,在这个概率下,琼斯采取哪种行动都无关紧要。如果其中一方博弈者采取一种次优行为(比如琼斯声称的,不管怎样他都将直走),那么另一方博弈者面对的将是一个标准的经济学最优方法,该问题可以用标准方法轻松解决。但是,只要双方同时寻求最优方法,那么他们就必须达到均衡点。用这种方法计算的均衡点定义了唯一的一种行为方式,即既不选择突然转向,也不选择继续行驶。在这个点上,博弈双方达到均衡。
这种博弈被称为均衡博弈 ,因为对于博弈双方来说,博弈公式所描述的均衡点是相同的,博弈的损益也是对称的。
正如纳什所证明的,对于每个博弈者来说,描述均衡策略的公式是不同的,因此每个博弈者的均衡点也是不对称的。由于纳什均衡可以扩展到非对称博弈,因此他能够证明,本质上这类问题的所有博弈都有一个均衡点。
这种方法被称为纳什均衡。 用通俗的话来说,纳什均衡是指一个不会令人后悔的结果,不管他人怎么做,各方对自己的策略都很满意。
纳什的观点影响深远,他将博弈论转向了对均衡点的研究。哪里才是一个博弈可达到的最优均衡点呢?纳什的方法使我们可以回答这个问题,而纳什本人也由于这个重要的发现获得了诺贝尔经济学奖。
纳什的均衡方法告诉我们,如果我们与对手有相似的目标,并且希望达到最好的结果,那么我们应该采取怎样的策略。
当然,在实际中,史密斯和琼斯可能提前并不知道对方的策略矩阵。对于他们来说,这是一个非常重要的问题,因为他们可能只有一次机会。在其他形式的此类博弈中,进行同样的重复博弈是完全有可能的。我们可以考虑这样一种情况:通过系统地研究琼斯的选择并且持续地调整自己的选择,史密斯可以保持自己的优势,直到他们两人达到均衡点。但是对于一次博弈,在实际中确定纳什均衡就相当困难了。
当前,博弈论的第二个重要局限是它无法告知我们在真实世界中,史密斯和琼斯应该如何寻找均衡点。博弈论可以描述一个达到静态均衡的系统,但是不能有效描述系统达到均衡的动态过程。这是一个重要的局限,因为动物的大部分行为必须用来解决动态问题——对于这些问题我们尚缺乏足够的理论工具。
《美丽心灵》这本书以及赢得奥斯卡金像奖的同名电影就是描述约翰·纳什的一生。当我写到这一段的时候,我又重看了一遍这部电影,我喜欢这部电影,因为它并不是描写纳什如何获得学术上的成功,而是和每一个普通人都要面对的问题一样,如何战胜自我。
伟大的人物拥有美丽的心灵,如果缺乏一颗美丽的心,无论在物质和权势上获得了多么大的成就,他都与伟大毫不沾边。在这个意义上纳什真正成功了,其人性的光辉超越了他在思想上的成就。这才是人生价值和意义的所在(也许对于现实中的个体来说,追求精神世界的自觉相比追求物质条件的满足来说是一种次优策略,但对于人类整体的进步和优化,这未尝不是最优的策略)。作为渺小但同样拥有去战胜自我缺陷的权利和勇气的我,为此鼓掌!值得尊敬的您呢?
生物学与博弈论
在恰尔诺夫应用经济理论的同时,进化论生物学家约翰·梅纳德·史密斯也想知道博弈论是否可以成为生态生物学家的有力工具。他在1982年出版的著作《进化论与博弈论》(与玛尔的《视觉》出版于同一年)的序言中写道:
荒谬的是,博弈论被更多地应用于生物学研究,而非它的设计初衷——经济学行为。
梅纳德·史密斯介绍了生物学博弈中最有名的鹰鸽博弈。
鹰鸽博弈是这样开始的:一个没有领地的动物侵入了另一个动物的领地,并且对其领地产生了威胁。随后,双方都必须作出决定,是使冲突升级(为领地而战),还是选择退让(不经战斗就将领地拱手让出)。假设某一方选择战斗,表现得像鹰一样,而另一方表现得像鸽子一样选择退让,那么鹰就会拥有领地控制权。如果双方都表现得像鸽子一样,那么就随机地选择一方拥有领地。最终,如果双方都表现得像鹰一样,那么它们就必须决斗。其中的一方会受伤,并且因此而减少它可以繁殖后代的数量,而另一方则会获得领地。这个简单的博弈可以由以下的策略矩阵表示(见表3-4)。
表3-4 鹰鸽博弈
对于梅纳德·史密斯来说,每一个变量都可以用进化论术语来表达:不同的结果中每个个体在繁殖适应性方面的得与失。获得领地可增加适应性,受伤则减少适应性。用这种方法可以总结出,如果领地价值很高,并且鹰与鹰在决斗中受伤的程度很低,那么基因上趋向于像鹰一样行为的动物就比像鸽子一样行为的动物更具有适应性。在这些条件下,梅纳德·史密斯认为,动物种群会向显示单一的纯策略均衡的一类物种进化,即最终所有的动物都会是鹰。
相似地,如果领地价值很低,而且鹰与鹰在决斗中受伤的程度很严重,鹰类则会逐渐消亡。所有鸽子一样行为的动物会繁衍更多的后代,会比鹰类动物更具有适应性。在这些条件下,种群会像鸽子一样显示纯策略行为的物种进化。
但是,如果领地价值很高,而且受伤的损失也很大,那么就会出现一种有趣的结果。在这些条件下,进化的唯一稳定的均衡策略就是在每一次遭遇时,每一个个体都按照固定的概率选择做鹰或鸽子。
更具体地说,从进化的角度来看,在进行鹰鸽博弈的种群中应该现出一种主导性的占优策略。在给定的条件下,动物在发生遭遇时表现得像鹰一样的概率等于领地的价值除以在鹰—鹰搏斗中受伤损失的价值,这样种群将会达到一个进化的均衡点。
梅纳德·史密斯认为个体之间以及个体行为的不可预测都可以通过某种进化论方式形成。他指出,第一,利用博弈理论的研究结果表明,在微观水平上,动物的行为必须是随机的、不可预测的,而在概率层面上则是合理的、可预测的。第二,这些复杂的不可预测的动物行为类型可由博弈论得到合理的解释。
博弈论仅仅要求每个个体的行为对于他的对手来说含有无法消除的不确定性,它并不要求动物行为从本质上来说都是不可预测的。有这一方面的证据吗?
1982年,哈珀在英国剑桥大学进行了一项针对鸭子群体觅食行为的研究,这项研究现在被视为该领域里的一个里程碑。
1979年冬天,33只野鸭游弋在剑桥大学植物园内的湖面上。哈珀想通过陆续扔给它们一些小面包球,来了解这些鸭子是如何竞争的。哈珀和他的一个助手每天都带着装有2克或4克面包球的篮子来到湖边,他们会在距离湖边20米的地方选择好各自的位置。看到信号后,他们开始向湖中投掷面包球,其中一人每5秒钟投一次,另一个人每5秒钟或每10秒钟投一次。哈珀的问题是,这33只鸭子将如何选择它们各自的位置?
考虑这样一种情形:哈珀每5秒钟投掷2克面包球,他的助手每10秒钟投掷2克面包球。那么,鸭子会有怎样的反应呢?表面上,这是33只鸭子的博弈,我们可以将它看作是有33个博弈者参与的纳什均衡问题。为了简化这个问题的数学解,可以有如下两个简化假设:第一,把它看作只有两个参与者的博弈:一只鸭子对一群鸭子。有33个参与者的情况下,也可以得到相同的结果,虽然复杂程度会大大增加。第二,不管是在哈珀面前还是在他的助手面前,所有的鸭子都有相同的机会得到掷出的面包球。
为了确定这个博弈的纳什均衡点,可以把被研究的这只鸭子称为史密斯,现在必须确定什么时候史密斯认为待在任何一个面包球投掷者面前没有差异,就必须找到史密斯的均衡点,在这一点史密斯会认为待在哈珀和他的助手两个面包投掷者面前的价值是相等的。
为了找到这一点,需要先定义每一片水域(水域的价值=收益/鸭子数量)。之后通过数学计算可知:对于史密斯来说,当2/3的鸭子位于哈珀的水域,另外1/3的鸭子位于他的助手的水域时,两片水域的价值是相等的。只要不是这种情况,对于史密斯来说最佳的选择是去和更少的鸭子争食。正是通过这样的方式,每一只鸭子的博弈决策促使鸭群达到均衡点。
以上所有的分析表明,当2/3的鸭子游弋在哈珀的面前,而1/3的鸭子游弋在他的助手面前时,此博弈可达到纳什均衡点。在这样的条件下,史密斯认为待在哪个喂食者面前都没有差异。
既然这是一个对称博弈,那么对于其他鸭子来说,只要包括史密斯在内的鸭群将2/3的时间花费在哈珀的面前,而将1/3的时间花在他助手的面前,那么它们也会认为在哪一片水域进食都没有差异。
令人惊奇的是,这恰恰就是哈珀观察到的结果。在这种情形下,鸭群按照理论预测的纳什均衡点进行了精确的划分,并且这种划分在开始投掷面包的60秒钟内就完成了,而在这个时候至少有一多半的鸭子还没有吃到面包球。更令人惊奇的是,每只鸭子也按照1/3或2/3的比率分配它们在两片水面的时间,又和理论预测的结果完全吻合。无论哈珀和他的助手怎样改变投掷面包的数量或速度,鸭群都会按照前面的公式迅速配置在每一片水域的数量。
博弈论确实相当有效,不但可以在理论上为不可预测的行为构建模型,而且还可以预测动物在竞争中的真实行为(至少是近似的)。它的缺陷是不能提供一种合适工具,来说明达到均衡点的动态过程。
神经经济学
在这一系列对人类认识的基础上,一门交叉的学科——神经经济学出现了。神经经济学研究的最终目的就是理解大脑是如何产生行为的。
神经经济学家认为,以概率论、博弈论和经济学理论为基础的模型是联系大脑活动与行为的有效工具(到目前为止,这是研究神经经济学理论的一个构建方法而不是理论最终的样子)。
现实中的动物要幸存下来,它们没有(实际上也不可能)以确定性方式解决所有问题。相反,动物体肯定至少有两类不确定性:一类是基于动物所面临的认识论上的不确定性;另一类是需要同其他生物进行有效竞争的不可简约的不确定性。
首先,从认识论的角度来看,动物(包括我们人类)通常对于周围的世界只具有不完全的信息,因此它们必须对周围世界的可能状态以及它们行为的可能结果作出统计的估计。
所有基于经济学的理论都有这样一个前提假设:动物可以学习和描述它们周围环境的先验概率,并且可以将这些先验概率储存起来以备将来之需。神经经济学家要做的事是用神经经济学方法找到这种假设的生理实验证据。比如,至少对于某些种类的记忆来说,可以在动物的学习工程中,在可识别的大脑结构中得到更新。
神经经济学家作了多种试验尝试,也可以说成绩斐然。1998年,乔希·戈德和迈克尔·谢德林关于猴子对视野中移动光斑的感知判断所做的实验观察发现,当猴子注视显示的光斑时,大脑里正在进行一种类似贝叶斯法则的估计运算。保罗·格莱姆齐和迈克尔·普拉特对位于脑顶皮层中的确定性决策的研究也支持了这一假说。
实验方法也用在了理解动物如何学习估计它们特定的反应所能产生的价值。弗莱堡大学的沃尔弗兰·舒尔茨通过研究大脑神经细胞的多巴胺神经元以及大脑内侧皮质区来探索这一问题。在现在广为人知的一系列实验中,舒尔茨发现这些多巴胺神经元可以传输一种信号,这些神经元激发潜在活动的比率反映出动物对价值的预期(有学者发现,人类头脑中多巴胺神经元对信息刺激而产生的活动模式,与股市中消息给股价带来的波动模式几乎一致)。
另一方面,对于不可简约的不确定性,神经经济学家认为无论什么时候,动物作出的决策一定会受到拥有智慧的竞争者的影响,博弈论可以用来描述这个生物体所面临的可计算问题。
经济学模型描述动物和人类在需要作出决策时所面临的任务,以及其决定应该怎样去解决问题。真实世界中的动物和人类的行为存在着偏差,它们的表现只具有次优性。也许这正是理解博弈论可以用来描述生物体行为的最好证据。
神经经济学方法允许既能够分析又能够产生不确定性的模型。这种类型的模型以及由它们得出的经验数据,不仅仅对于研究大脑来说至关重要,对于研究人类行为的经济学来说,也具有高度的重要性。生物学家威尔逊在1998年提出,社会科学与自然科学相融合是不可避免的,同时也是必要的。这种融合首先表现为人们普遍认识到经济学和生物学是研究同一主题的两门学科。