Local EPUB Text
·引言· 博弈中的合作策略
·引言·
博弈中的合作策略
最近有位朋友告诉我,有一群科学家发表了一篇报告,研究办公室茶水间的茶匙是怎么不见的。他得意扬扬地大声宣告:“一切都是博弈论!”我再三感谢了他,然后将这个例子也加进我已然收集成堆的案例之中。
博弈论,又叫赛局理论,无所不在。虽然名称中用了“赛局”两字,但其实讲的并不是比赛,而是我们每日与人互动的策略。自从我宣布要写关于博弈论的书,就接到许多朋友的来信,分享他们从报纸上看到的例子和个人经验。我想看看,博弈论提出的新观点是否能让我们发展出新的合作策略,再亲自应用于日常生活的各种情境中,不管是传统的英式晚宴,还是激烈的棒球赛、拥挤的人行道、热闹的大卖场、人满为患的印度街道,甚至是澳大利亚的乡村酒吧里。
博弈论可以告诉我们,在家庭失和、邻里矛盾、劳动争议、名人离婚案例中,究竟为什么有这么多冲突、毁约、背信以及欺骗;博弈论也可以告诉我们,面对各种竞争和冲突,最佳的应对策略是什么。正因如此,自从20世纪40年代末博弈论诞生以来,大型企业和军方莫不深感兴趣;商人能据此赢过对手,西方世界的军事思维也因为博弈论的加持,进展到吓人的程度。博弈论专家常常能同时涉足商业和军事领域。举个例子:五位赢得诺贝尔经济学奖的博弈论研究者,都曾经在某个阶段获聘为美国国防部的顾问。
但博弈论还有另外一面,它探讨的不是冲突,而是合作;不是竞争,而是互助。生物学家利用博弈论来了解“适者生存”的自然界要如何演化出合作关系,而社会学家、心理学家、政治学家则用博弈论来了解合作时面临的问题,毕竟要解决全球变暖、资源耗竭、环境污染、恐怖主义、战争等问题,人类势必比以往更需要合作。所以,本书的目的就是了解博弈论是否能应用在日常情境,以及是否能延伸其中的经验去解决更大的问题。至少能找到一点线索,作为我们每个人努力的行动指南。
博弈论专家发现,所有相关问题其实有一个神秘的共通之处,也就是其中隐藏着一个合作障碍,如果我们不尽快想办法解决,就可能造成重大损失。这个障碍是一个进退两难的逻辑陷阱,不论是家庭争执、邻里矛盾、日常社交,还是全球议题,都存在这个陷阱,而且常常不为人知。甚至连办公室茶水间里的公用茶匙不翼而飞,起因也在于此。
对此有一个解释,即“公地悲剧”论。美国生态经济学家加勒特·哈丁在他于1968年发表的文章中提出了这个理论。其实早在亚里士多德时代,哲学家就已经在为这个问题烦恼了。
哈丁用一则寓言来阐述“公地悲剧”:有一群牧人,每个人都将自己的牲口赶到公共牧场上吃草。有一天,其中一个牧人想多养一只牲口,好增加一点收入,而且只不过多一只,对整片牧场只会增加一点点负担,看似十分合理。但等到所有牧人都这么想时,悲剧就发生了,每个人都多养了牲口,牧草不够吃,很快牲口便全部饿死了。
这群科学家将同样的理论套用到茶匙的问题上:用茶匙的人认为(不论是否有意),如果拿走一只茶匙,自己的利益就能增加,而其他人的利益平均下来只会损失一点点(毕竟还剩下很多茶匙啊)。但如果这么想的人多了,茶匙这个公共物品就岌岌可危了。
如果把茶匙换成土地、石油、渔业、森林,或是任何其他公共资源,就能清楚地看出,许多现在十分严峻的全球问题,其实都起源于这种逻辑的恶性循环,获利的是某一个人或某群人,成本却要由所有人一同负担。
如果我们之间有人愿意为了共同利益合作,但又有某些人为了私利而破坏合作(在博弈论里称为“背叛”或是“作弊”),就可以看到“公地悲剧”造成的毁灭性结果。私利的维持无法长久,等到每个人都开始这么想,就会导致合作破局,生存环境每况愈下。人人都想谋得一己私利,最后反而人人都是输家。
如果我们愿意改变自己的行为,就是更有道德,更愿意为他人着想,就能避免“公地悲剧”。可惜这只是做梦,虽然偶尔做做这种梦也无可厚非,但毕竟我们都不是特雷莎修女,最好还是快快认清事实:我们总得有点好处,才愿意合作。不仅个人如此,国家亦然。2006年颇具影响力的《斯特恩报告》就已指出,各国一定要先看到在短期内就能直接获得的经济利益,才会愿意合作解决问题。
对于这种态度,博弈论不会下道德判断,而是接受事实,承认自私其实是我们的主要动机之一;博弈论评价各种不同策略,也是以是否符合自身利益为出发点。合作策略的矛盾在于,合作是为了将整体的饼做大,但每个参与者又希望自己分到的饼大一些,最后就会为贪婪所困,犹如卡在网里的龙虾。
批评贪婪其实无济于事,但如果人人(和各国)都只要拿到公平的一份就满足,也不失为好事一桩。更重要的是要先认识这个逻辑陷阱,才可能避开或脱离陷阱,进而达成合作。
在远古时代,这个陷阱便已存在,例子可见于《圣经》《古兰经》及许多古代典籍、史书、小说、歌剧等文学作品中,当然,在许多现代故事当中也不乏这类例子。但是,直到20世纪40年代晚期,数学家纳什(电影《美丽心灵》的主角,患有精神分裂症,1994年获诺贝尔经济学奖)利用博弈论剖析这个陷阱的内部机制时,我们才认清了它的本质。
这些内部机制正是本书阐述的重点。它们会造成许多社会困境。博弈论研究者给这些困境取了一些耐人寻味的名字,其一就是“公地悲剧”,著名的还有“囚徒困境”,可用美国的认罪协商制度来说明(请见第1章);其他还包括:“懦夫博弈”(古巴导弹危机时,美国总统肯尼迪和苏联领导人赫鲁晓夫因此差点造成世界毁灭)、“志愿者困境”(阿根廷火地岛当地所讲的亚根语中,有一个词可以表达这种两难困境,叫作“mamihlapinatapai”,意思是“双方互望,希望对方去做一件彼此都希望能完成但自己又不想做的事”),以及“两性战争”(例如,夫妻或情侣一起出门,但男生想看球赛,女生想听歌剧)。
在这些情境中,只要双方合作就能得到最佳结果,但纳什陷阱(也可被称为纳什均衡)却使我们随着自利的逻辑而陷入困境,其中至少有一方的情况可能会变得不利,但如果要逃离这个困境,情况反而会更糟(由此可见,这的确是个有效的陷阱)。如果我们想知道如何合作得更有效,就必须想办法避开陷阱或从中逃离。博弈论已经点出了这个问题,但是能够提供解决问题的线索吗?答案是肯定的。
有些线索在于研究合作发展的本质,有些则用于仔细审视那些我们传统上用以赢得并维持合作的策略。一些行之有效的合作策略包括“我切你选”、新的合作协商方式(甚至很漂亮地用上了量子力学)、刻意限制自己作弊或背叛的可能选项、改变奖励结构,以及除去破坏合作的诱因。
有些最重要的线索来自计算机模拟,是将不同的策略两两比较,看哪个能够胜出。初步的结果可见于罗伯特·阿克塞尔罗德于1984年出版的著作《合作的进化》。生物学家理查德·道金斯后来为该书写了序言:“我们应该先把世界上的领导人都关起来,读完这本书再放出来。”从过去二十年的历史来看,恐怕世界上没有几位领袖曾经用这种新颖又积极的方式来看待合作问题。
关键是“一报还一报”的策略(以及后续的做法),这种策略可能会造成冲突的扩大,但也可能带出“你帮我挠背,我也帮你挠一挠”的合作,这在自然界和人类社会中都可见到。究竟是冲突还是合作,难以断言,只要形势有些许改变,结果就可能全然改变,就像是经济大繁荣之后接着大萧条,动物族群扩张之后又会萎缩。数学家将这个关键点称为“分歧点”(bifurcation point),在这个点上所做的选择,会导致完全不同的结果。要想达成合作,就要找到策略,让选择的路径走向合作,而不是走向冲突。
近年来的研究已经提出一些有洞见的想法,或许可以达到这个目标。虽然博弈论并非灵丹妙药,但的确能够运用新的观点来审视合作的演进方式,并提出新的策略,或为老策略加些新风格。
在本书中,读者可以试着了解这些策略,并应用到日常生活中。我的目标是找出全套的合作策略,就像我在当科学家的日子里,曾经慢慢建立起一套完整的科学问题处理方法。科学家的生活虽然无趣,但进行关于合作的实验却很有意思。结果有时引人发笑,有时让人警惕,但总能让人加深了解,看清是什么促成人类合作,从而继续合作。
最后应该强调,我并非专业的博弈论专家,只是一个关心此事的人,一个关心此事的科学家,想试着解答一些最迫切的社会问题。博弈论可以从多数人不熟悉的角度切入,看看这些解答是否与真实的生活息息相关。希望读者也能与我一起享受这个过程。
本书架构
本书第1章介绍了纳什均衡的基本概念和著名的“囚徒困境”。囚徒困境会造成许多世上最严重的问题,包括公地悲剧。第2章介绍如何利用“我切你选”等策略,公平分配资源。这两章的结论是:如果希望合作长久,就不能只依赖外来的权威或自己对“公平”的认知,而要想想如何在我们的自身利益不受损的前提下,让合作自我规范、自动运作。
第3章是本书的重点,我以博弈论来审视究竟社会困境因何而生。接下来的几章则讨论合作策略,其中有童年“石头、剪刀、布”游戏的变形、新的合作协商方法、促成信任的方式、“一报还一报”策略的运用。我会解释自然界中产生这些策略的原因及过程,并研究人类社会如何运用这些策略来促进合作,而非引发对立。接着我还会探究如何改变博弈本身,以避免陷入社会困境(social dilemma)。解决方法可能是引入新的参与者,抑或通过量子力学来解决。
本书最后则是回顾所谈过的合作策略,并提出我个人认为最有效的十大策略。如果各位急于知道结果,不妨先看看这一章。
附带说明
随着研究的逐渐展开,我发现一件令人困扰的事:以下的几乎每一段论述都可以发展成一篇论文。但为了不让这本书厚得像《大英百科全书》,我尽量简化或省略了对许多复杂因素的讨论。如果本书能激起各位的兴趣,想更深入地研究,可去找任何一本博弈论教科书来看。其中主要有以下几点。
•纳什陷阱。博弈论专家可能不太欣赏我介绍纳什陷阱的方式,因为这会让人误以为纳什陷阱一定会导致不好的结果。但因为本书要讲的正是各种不好的结果,以及如何避免这些恶果,所以我并未改变介绍方式。然而要请各位读者了解的是,其实纳什陷阱可分为三种:轻度陷阱、中度陷阱和重度陷阱。轻度陷阱虽然也会迫使我们选择某些策略,但其实和我们为了实现共同利益而自愿采取的策略并无不同。本书只在第5章、第6章略微提及了轻度陷阱,大部分篇幅仍旧以中度及重度陷阱为重点。
• N人情境。合作可以发生在两人或两个群体间,也可以发生在多人或多个群体间。本书的范例多为前者,只偶尔提到较为复杂的案例。
•完整信息和不完整信息。博弈理论学家会区分信息是否完整。虽然我也可以那样做,但我并未如此。有时候我们对他人过去的行为知之甚详,但也有时候只能凭手上的信息做最佳的猜测。通常,只要看上下文,就能知道我书中的例子属于前者还是后者。
•同步决策或逐序决策。我们做决策的时候,有时完全不知道对方采取的策略,这也就是博弈论研究者所称的同步决策;有时候,我们可以等对方做出决定并采取行动后,再根据这些信息做决策,这被称为逐序决策。同样地,只要根据上下文判断,就能知道书中的例子属于哪种。
•理性。不论是否为博弈论研究者,都常讨论“理性”究竟为何物。那些导致公地悲剧和其他社会困境的逻辑,可能并非真正的理性。而且有时候,似乎我们能做的最理性判断,竟然就是不理性!相关的例子,在本书中会一一提及。
兰·费雪
于英国埃文河畔布拉德福德镇
以及澳大利亚布莱克希斯镇
2008年5月