Local EPUB Text
序贯博弈
未知
序贯博弈
到目前为止,我们分析了参与者同时做出决策的博弈。在囚徒困境博弈或者石头-剪刀-布博弈中,每个参与者在得知其他参与者的决定之前,决定自己要采取的策略。然而在许多真实世界的情形中,一个人或企业往往必须在对手之前做出决策。当参与者并非同时而是依次行动时,我们称之为序贯博弈。
前向思考,逆向行动
在序贯博弈中,策略行为的一个特别重要的特征就是“前向思考,逆向行动”。首先你必须前向思考:你正在考虑的情形中所有可能的结果都是什么?你更倾向于哪种结果?接下来你必须逆向行动:为了实现你更倾向的结果,你需要做出什么选择?
这种反向分析问题的过程,即从最终的选择开始逐项向前,直至确定最优策略,被称作逆向归纳法(backward induction)。这可能是你一直采用但并不自知的方法。
举一个简单的例子,假设你正在进行下一学期的选课。面对诸多选择,你会怎么做呢?首先,前向思考,假设你希望成为一名荣获普利策新闻奖的记者。接下来逆向行动。要获得普利策奖你需要做什么呢?你需要得到一份顶尖报社的工作。而你如何得到顶尖报社的工作呢?你需要主修英语专业。而这又要求你修完非小说类写作的必修课程。因此你这学期应该选写作入门课程。
如图9-6所示,这一推理过程是逆向归纳法的典型例子:从你想要的结果开始,按时间逆向行动,依次决定为了达到目标,你必须做出的每个决策。
图9-6 利用逆向归纳法进行决策
阻止对手进入市场:一个序贯博弈
如果其他参与者为了回应你的决策而做出的行为会对你产生影响,那么在序贯博弈中,逆向归纳法是一个特别有用的分析方法。在商业中尤其如此;许多企业不得不在序贯博弈中做出策略决策。此类例子之一就是进入某一市场。假设麦当劳公司正在考虑在一个没有快餐店的小城镇上开一家餐厅。同时假设麦当劳只考虑选址在能够获得至少10%投资回报率的地方,因为公司把钱转投其他项目时能够获得10%的回报。
公司高层在两处可行的选址中举棋不定:在市中心,地价昂贵,但顾客到店用餐更方便;在郊区,地价便宜,但顾客必须开车才能到达。公司的计算结果(在这个例子中是假定的)表明,位于郊区的一个麦当劳餐厅能够产生20%的回报,而选址于市中心可以赚得15%的回报。如果麦当劳的分析过程到此为止的话,它将会选择将新店建在郊区。
然而,如果公司高层进行策略思考,就会意识到存在汉堡王也考虑进军同一个城镇的可能性。麦当劳的计算表明,如果存在两个相互竞争的快餐店,一个在市中心而另一个在郊区的话,由于大多数顾客不愿意驱车驶往郊区,市中心的快餐店会获利颇丰。由此市中心的快餐店将赚得12%的回报率,而郊区的快餐店仅获得2%的回报率。如果在两家店都在郊区,每一家都将获得8%的回报率;如果两家店都在市中心,每一家将获得4%的回报率。
得知汉堡王不确定是否进入市场之后,麦当劳应该怎么做呢?如果麦当劳将新店建在郊区,可以预见由于受到12%回报率的吸引,汉堡王将会在市中心开设新店。这将会把麦当劳的回报率降至仅2%。但是如果麦当劳选址于市中心,可以确信汉堡王根本不会进入该市场。这是因为如果汉堡王也选址于市中心只会获得4%的回报,而选址于郊区则仅仅获得2%。麦当劳可以确信汉堡王将不会开设新店,而是选择将钱投向具有10%回报率的其他项目。
我们可以利用名为决策树的图表对麦当劳面临的决策进行分析,如图9-7所示。既然麦当劳是博弈中的先行者,第一个决策点代表了它选址于郊区或者市中心。无论麦当劳做出何种选择,接下来汉堡王决定是将新店建在郊区、市中心还是不开设新店,这体现在决策树的第二个阶段。
图9-7 进入市场的决策树
我们可以采用逆向归纳法分析对麦当劳而言最好的做法。从决策树的最右侧开始,我们可以发现如果麦当劳选址于郊区,汉堡王将会在市中心开设新店。但是如果麦当劳抢先在市中心开店,汉堡王将选择不进入市场。决策树显示了麦当劳实际面临的回报率并非最初设想的那样,在选址于市中心的15%和选址于郊区的20%两者之间选择,而是在选址于市中心的15%和选址于郊区的2%之间进行选择。尽管对于麦当劳而言,没有竞争者时选址于市中心并非最好的决策,但这样做能够阻止竞争者进入市场,因此,这是最好的策略决策。
序贯博弈中的先发优势
在市场进入博弈中,先行者麦当劳最终获得15%的回报率,然而后发者汉堡王却不得不投资于别的项目获得10%的回报率。如果汉堡王率先进入城镇,它就可以将自己置于麦当劳的境地,在市中心建新店并且将麦当劳排除在市场之外。在这一博弈中,无论谁率先进入城镇都将获得较高的回报,后进入的公司只能获得较低的回报。这类博弈中存在先发优势(first-mover advantage),即率先行动的参与者相比跟随者能得到更高的收益。
在只进行一个回合的序贯博弈中,先发优势十分重要。设想一个公司与工会就工资进行讨价还价博弈。实际上,两方的讨价还价是如何将创造的剩余在公司和劳动工资两者之间进行分割(记住在这一情形下,剩余是指人们从交易中获得的好处)。如果这是只有一个回合的序贯博弈并且公司先采取行动,它可以提出只支付剩余的1%,工会将面临的选择是:可以接受公司的提议,或者通过罢工拒绝提议,这将让公司和工会两者获得的剩余均为零。既然1%总比什么都没有好,工会只好接受这一吝啬的提议。图9-8的决策树展现了这一过程。
图9-8 最后通牒博弈的决策树
然而,如果工会能够率先选择,它将得到剩余的99%。可以设想公司宁愿付出高额工资,也不愿意工人罢工,一分钱也赚不到。经济学家将这一情形称为最后通牒博弈。一个参与者做出提议,另一个参与者只能简单地选择是接受还是放弃。正如我们在下一部分中将看到的那样,如果另一个参与者具备还价的能力,也就是将一个回合的博弈变为多个回合的博弈,情况将会发生戏剧性的改变。
重复序贯博弈
我们已经看到重复博弈能够让合作得以维持,从而改变诸如囚徒困境等同时博弈的性质。重复博弈也会减少先发优势,从而改变序贯博弈的结果。
进行还价的能力让讨价还价从一个由先发优势主导一切的博弈转变为一个耐心成为制胜策略的博弈。为什么呢?在几乎所有的情形下,既定数额的一笔钱处于未来时的价值不如这笔钱处于当下时的价值大。讨价还价需要时间,在参与者达成一致之前,伴随着每一回合讨价还价的过程,他们所分配剩余的价值都在不断地减少。在公司与工会之间的工资谈判中,我们可以想象这种减少源于谈判期间错失的生产时间。在这一情形下,越有耐心的参与者,即相比于当前的金钱,更看重金钱未来价值的人,更具有优势。能够拒绝妥协时间越长的参与者具有越强的讨价还价的能力,因此可以获得更好的收益。
实际生活中大部分工资谈判不会耗时多年(尽管有些会这样)。如果每个参与者知道对方的耐心有多大,那么两方不必进行多回合博弈。相反,公司可以简单地按照已经完成所有回合博弈时,最终将会发生的结果进行提议。此时,剩余的分割将与每个参与者的耐心成比例。
序贯博弈中的承诺
回顾前面的内容,在类似囚徒困境的同时博弈中,做出可信的承诺能够改变收益并且影响其他参与者的策略。我们将会看到在序贯博弈中也存在同样的情况。思考一个来自军事策略的例子,一位将军利用承诺策略,看似矛盾地限定自己的选择,实则提高了胜利的机会。
在16世纪早期,西班牙征服者荷南·科尔特斯到达了墨西哥海岸,想要宣称这片土地属于西班牙国王。而这片土地当时隶属于强大的阿兹特克帝国,帝国拥有雄厚的战斗力量。图9-9表明了这一博弈的决策树。两方都可以选择前进战斗或者撤退保命,并且阿兹特克人可以先行选择——决定如何应对荷南的入侵。如果阿兹特克人撤退,他们确信荷南将会继续前进并且占领他们的土地。如果阿兹特克人奋起反抗,那么荷南将面临两个选择:撤退得以活命,或者继续前进并殊死奋战。
无论荷南宣称自己的士兵如何勇敢忠诚,阿兹特克人都会预期,如果西班牙士兵面临的是一场殊死搏斗,他们将宁愿安全地撤离到船上。因此,阿兹特克人会决定奋起反抗。如果博弈的双方都理性行事,结果将是荷南选择撤离。
图9-9 荷南与阿兹特克人的决策树
预感到阿兹特克人的计谋之后,荷南采取了一个极端的举动:他烧掉了自己的战船,切断了胆小士兵撤退的后路。图9-10表明了这一大胆的举动如何改变了决策树。在新的情形之下,阿兹特克人知道如果他们反抗,荷南除了殊死奋战之外别无他选。因此,阿兹特克人决定相比于冒死抗争,他们更愿意撤退偷生。
图9-10 烧掉战船后的决策树
通过减少选择做出承诺,荷南强势地改变了对手的策略,这一承诺带来了荷南原本无法获得的收益。“破釜沉舟”是历史上著名的承诺策略的例子。想要了解承诺策略的更多应用,请阅读以下现实生活专栏。
现实生活 奇爱博士,又称:我们如何学会停止恐惧并爱上承诺机制
思考“懦夫”博弈,两个人驾驶汽车开足马力朝对方行驶。如果没有人转向,他们将会迎头撞上。但退一步讲,这需要钢铁般的意志。通常情况下,会有一个人先丧失勇气,改变方向为另一个人让路,这样就输掉了比赛,成为“懦夫”。显然,这一博弈中存在一个细微的策略失误,如果两个人陷入僵局都不转向,将会让结果变得十分糟糕。
懦夫博弈可以帮助我们理解为什么冷战期间美国和苏联储备了大量的核武器。他们的策略就是积累足以摧毁对方的杀伤性导弹,也被称为“同归于尽”。军事和政治专家认为,如果一个国家做出袭击行为,另一个将会以更强的武力加以还击。而这将最终导致共同毁灭,就像一个全球范围内的惨烈车祸。鉴于同归于尽的威胁,专家指出,无论关系恶化到什么程度,任何国家都不会冒险攻击对方。这就像当撞车迫在眉睫时,两个驾驶员都确定对方一定会转向。实际上,生活在冷战时期的人们并不觉得这一逻辑能够让人安心。
为了在懦夫博弈中取胜,你会怎么做呢?你将会效法西班牙将军荷南登陆墨西哥后烧掉战船的做法。通过当着对手的面将方向盘扔出窗户,你传达了自己将采取坚持向前行驶的策略承诺。对手了解到你不会退缩,因此面临了要么转变方向输掉比赛,要么迎头相撞两个选择。
1964年的经典电影《奇爱博士》用戏剧形式滑稽地将核问题中的承诺策略加以呈现。电影中虚构出苏联建立了一个“世界末日装置”。如果任何核武器在苏联境内爆炸,这个装置将会自动向美国发动全力进攻。由此,美国确信如果自己发起攻击,苏联就会毁灭世界,这在理论上保证了苏联永远不会遭受袭击。如果你看过了这部电影,你就会知道电影以世界被蘑菇云吞没而剧终。最终,世界末日装置并非阻止,而是导致了同归于尽。
真实生活中,还没有人创造出世界末日装置,关于核战争的恐惧自冷战以来也逐渐消退。但是冷战的后遗症是现在世界上存在足够将地球轰炸多遍的核导弹。主要的核武器大国勉强就减少核储备达成一致。这也意味着仍然存在新的武器竞赛——以及另一回合核武器懦夫博弈的可能性。
资料来源:http://www.thenation.com/article/dr-strangelove