bangst

学习进度

阅读时长

未满 1 分钟

最近阅读：未开始阅读

核心概念

待提炼

章节学习

1
不用之用无我而我（代序）
2009年的最后一个月，我和太太搬到上海郊区，离开了繁华的城市中心，开始了属于我们俩的婚后生活。兴盛是术，寂寞是道。城市是否真的能让生活更美好，要看你如何定义美好。与喧闹、时尚、浮躁、急促的街市生态相比，我更喜欢城市外的这一处乡村，乡村间的这一块田野，田野边的这一栋小屋，小屋内的这一份宁静。在安宁、清淡、寂寞之中，想人生大事不觉其重，做生活琐碎不觉其轻。当
待学习
开始阅读
2
如何获得无风险收益
什么是套利？是什么创造了套利的机会？交易市场中的商品价格是如何被“制定”出来的？现货价格与期货价格为什么会不同？它们之间有什么样的关系？期货价格真的是人们对远期商品价格的预期吗？从同一个时间点来看，为什么黄金的远期期货价格总是比近期期货价格要更高，无论是牛市还是熊市？其他商品为什么不是这样？市场价格会不会“出错”…… 求知的道路是从提问开始的。因为人类有一种
待学习
开始阅读
3
用模型帮助你获利
当然，有些朋友可能会怀疑刚才例子的可操作性，理由是现实生活中不存在这么简单的情况。的确，在例子中我们把现实状况抽象化了，至少忽略了许多交易成本，以及交易中有可能产生的摩擦。比如：贷款的手续和时间成本，市场交易必须支付的手续费用，期货交易中的保证金成本，等等。不过这不足以否定我们的研究方式。如果你问一位物理学家，一个铁球从10层楼顶落下来需要多长时间，他可能
待学习
开始阅读
4
一价定律
为什么会存在一价定律？因为有套利者的存在。套利者为了获得真实利润，寻找并发现等同资产的价格差异，购买并立即出售这些资产。一价定律被套利过程强行驱动。几千年来，黄金已经广泛地被用作价值储存和清算支付的手段。作为一项商品，它意义明确，其质量能精确界定。我们就采用这一个最简化、通俗的商品来介绍套利如何运作，及其如何导致不同区域的同类商品价格趋于一致。如果质量
待学习
开始阅读
5
等同却不相同
从严格的意义上说，套利这个词最初的意思是从同一种商品在两个市场上的不同价格之中获取利益。比如：小王托朋友从欧洲的免税商店购买名牌皮包和化妆品，又从香港的超市购买奶粉，并通过自己开设的网店以高于购买地的售价卖给中国内地的消费者。这就是一种最原始的套利行为。通常情况下，小王需要预先垫付商品的货款，这对他来说就存在风险，如果小王足够精明，想办法做到预先收取买家的货
待学习
开始阅读
6
套利真的无风险吗
上一节的例子听上去十分诱人，套利收益似乎像一个憨厚的大头娃娃，经常笑眯眯地向人类招手。但是，学理的力量是薄弱的，更大的教化来自社会现实。套利者发现，现实情况并不像理论推导这么简单。价值等同的资产长期拥有不同价格的事实并不罕见。最能说明市场价格不符合一价定律的例子是，两只完全相同股票的交易价格并不完全相同的案例。案例：皇家荷兰和壳牌公司股票价格的长期偏离
待学习
开始阅读
7
风险在哪里
巴菲特曾说，如果你参加一个4人的牌局，如果在15分钟后你还没有搞清楚这个牌局的赢家和输家会是谁，那么输的人一定就是你。要看清赢家和输家的第一步是要知道：都是谁在参与这个游戏，他们又是以什么方式来参与这个游戏。当今，许多学者都赞同市场交易的参与者大致可分为两类。第一类，他们掌握较完全的基础信息，拥有较完整的知识，并且具备更多的理性，他们会根据正确的资产组合理
待学习
开始阅读
8
期货市场中的套利
如何在商品期货市场上套利是本书讨论的重点。名不正则言不顺。在这一节，我们先为商品期货套利交易正正名。学过期货市场基础知识的朋友几乎都知道教材中语言烦琐却言之无物的套利定义，让我们一起来重温一遍：所谓套利交易，即买入一种期货合约的同时卖出另一种不同的期货合约。这里所指的期货合约既可以是同一种商品的不同交割月份；也可以是相互套利的两种不同商品。当然，还可以
待学习
开始阅读
9
看不见的手
亚当·斯密每一个人都一直努力于为自己能支配的所有财产寻找一种最有利的用途。事实上这是出于个人利益的考虑，而不是出于对社会利益的考虑。但是对其自身利益的考虑又很自然地，甚至是必然地促使这个人选择对社会最有利的用途……他只是想获得自己的收入，而且也是这么做的，但是与许多其他情况一样，他在一只看不见的手的引导下得到了一个并不是完全出于自己本意的结果。 ——亚当·
待学习
开始阅读
10
价值理解
我们已经知道，套利者是在买入一项资产（价格低于价值的资产）的同时卖出另一项资产（价格高于价值的资产），这两项资产虽然不一定完全相同，但其价值相当。因此搞清楚对象资产的价值就是必不可少的步骤。价值这个概念其实非常模糊。在这一问题上人类从来没有达成过共识。有些人认为价值是客观存在的，他们所说的价值指的是一种叫内在价值的东西。他们声称，每一个投资工具，无论
待学习
开始阅读
11
未来是否能够根据过去的价格预测
中国人都很熟悉技术分析。听听这些行话，“持涨杀跌”、“转持强势股”、“卖掉这只股票，它的表现弱于大盘”、“不可逆市而为”，等等，股民就是在这种语言环境中培养成长的。这些都是技术分析师的行话俚语。本节我们就来说说技术分析。技术分析师认为，历史就是有自我重复的习惯。他们的理由如下：第一，大众心理中的群体本能促使趋势得以自我延续。当投资者看到某项资产（股票
待学习
开始阅读
12
股票价值该如何估量
小弗雷德·施韦德的著作《客户的游艇在哪里》中讲述了一个得克萨斯州经纪人的故事。这位经纪人以每股760美元的价格把某只股票卖给一位客户，可在他卖出的时候，客户以730美元的价格本来也能买到。客户了解真相之后，大为震怒，满腔愤慨地抱怨经纪人。“嘘！”这个经纪人没等客户说完，就用洪亮而低沉的声音打断他说：“你们这些人都不明白咱们公司政策的好处，咱们公司为客户选择投
待学习
开始阅读
13
商品价值又如何估量
伟大的思想者会追问一些人们习以为常并认为理所当然的问题。就像2000多年前亚里士多德闲来无事在市场中瞎逛时见到有人用5张床换1间房屋所想到的问题，是什么原因确立了这样的交换公式：1间房子＝5张床，其背后的“共同物”到底是什么？人物介绍：亚里士多德亚里士多德亚里士多德（Aristotle，公元前384—前322年），古希腊斯吉塔拉人，世界古代史上最伟大的
待学习
开始阅读
14
达到均衡的价格
事物都有两重性，有需求才会有供给。说到需求与供给的关系对商品价值的影响，我们必须提到一位现代经济学的奠基人。正是在他的努力下，19世纪末和20世纪初，经济学从仅仅是人文科学和历史学科的一个分支发展成为一门独立的学科，具有与物理学相似的科学性。也是在他的影响下，剑桥大学建立了世界上第一个经济学系。他就是阿尔弗雷德·马歇尔。人物介绍：阿尔弗雷德·马歇尔阿尔
待学习
开始阅读
15
商品套利实践（一）：可替代的商品
西方有一句古老的谚语：只要学会说“供给和需求”，甚至连一只鹦鹉都可以成为经济学家。这似乎有一些道理。至少，当我们了解了效用的概念和商品价格由供应和需求决定的机制，我们就可以对第一章中所说的“商品之间经济学上的联系”理出一些头绪。以下的两节内容我将从需求和供给的变化出发来分析两个农产品套利的实例。人类很聪明，对于如何满足自己的需求，总能想出各种各样的方法。
待学习
开始阅读
16
商品套利实践（二）：稀缺资源的配置
这个故事的女主角还是玉米，男主角换了，我们请出了大豆。大豆可是个宝贝，这个原产地是中国的含有丰富蛋白质的豆科植物已有5000年的栽培历史。中国人喜食大豆，并把它做成了千奇百怪的美食。比如豆浆、豆腐，把豆腐再经卤制、炸卤、熏制、干燥后，就制成了豆腐丝、豆腐皮、豆腐干、腐竹、素火腿，等等。不仅如此，经微生物发酵后，大豆还被做成了腐乳、豆豉等。千百年来，大豆为以
待学习
开始阅读
17
商品套利实践（三）：改变你的视角
英国哲学家约翰·洛克在1690年出版的《人类理解论》中发现人性中有一种犯错的倾向，就是“以词代物”。他注意到，我们有一种倾向性举动，就是会对语言相关的概念赋予一个客观的现实意义，在此过程中会造成这个概念的重要性被夸大。当概念被词汇凸显出来之后，在人们的眼中，它们就开始变得“与事物的本质相当契合，与它们的真实存在完全匹配”。在人的观点有了自己的名称之后，它们
待学习
开始阅读
18
并非悖论的悖论
抽象思维是区别人和动物的一个特征。动物会熟知一项事物，但不会认知一项事物。熟知仅仅意味着表象，而认知则包括并预先假定了表现。正如卡西尔在他的著作《人论》中所说：“要表现一个事物，仅仅能够为了实际的用途而以正确的方法操纵它是不够的。我们必须对这个对象有一个总体的概念，并且从各种不同的角度来看待它，以便发现它与其他对象的各种关系。换言之，我们必须在一个总体
待学习
开始阅读
19
可以被预测的不理性行为
越来越多的对人类决策的研究揭示了人们犯下的系统的不理性行为。下面是几个发现：人们过度自信。设想有人向你请教一些数学问题，比如，联合国有多少非洲国家，北美最高的山有多高，等等。但是，不是要你给出一个单个的数字，而是要你给出90％的置信区间，即你有90％的自信真实数字会落入其中。当心理学家进行这类实验时，他们发现大多数人给出的范围是极小的：真实数字落入其区间
待学习
开始阅读
20
前景理论
自豪和悔恨之类的情绪也是影响投资者行为的重要因素。比如，很多“炒”股者可能会觉得自己若坚守正在赔钱的仓位，最终总会把亏损的钱赚回来。他们往往会卖掉正在赚钱的仓位，而守着亏钱的仓位不放，这样做为的是免去悔恨之情。一项由行为心理学家对1万名股票交易者所做的研究显示，投资者有一个明显的处理倾向：卖掉赚钱的股票，而抱牢赔钱的股票不放。这种行为被称为处置效应。卖掉已
待学习
开始阅读
21
大脑与不确定性（一）：历史上的探索
笛卡儿的二元观点在学术圈中，几乎像公理一样被人们深信不疑的是，我们现在所谓的神经科学，是由17世纪法国的数学家、哲学家兼生物学家勒内·笛卡儿创建的。勒内·笛卡儿笛卡儿于1596年出生在法国一个叫拉艾的城镇，现在该城镇已经改称为笛卡儿了。他于1650年去世，在经过3个半世纪之后，人们还熟知的是他在宇宙哲学方面的研究，是他回答“对于宇宙我们确知什么”这一问
待学习
开始阅读
22
大脑与不确定性（二）：神经经济学
定义目标玛尔曾经指出：“通过搞清楚需要解决问题的本质来理解一种算法，比通过研究使该问题被体现的机制（及硬件）更为快捷。”而进化论提供了这样一个模式，它指出所有行为的最终目标只有一个——最大化生物体的内在适应度。在整体意义上，可以认为神经系统的功能就是依托进化适应度进行决策。即便是笛卡儿提出的反射，也可以被看作是神经系统在面对一个很简单的、为生物体确定一个
待学习
开始阅读
23
智慧源于我们对自身无知的觉悟
正如行为经济学家已经观察到，在许多抽象的情况下，人们只是按次优决策行事。这点似乎可以证明，从整体上讲，人类并不具备完全的理性。神经经济学家却告诉我们，这一判断忽略了“利用进化论和经济理论可以完成什么”这一问题。原则上，概率论为我们提供了一种可以得到最优统计估计的数学方法。而自然选择原理为我们提供了一种从理论上对效用函数进行完善的方法。从进化论的意义上讲，
待学习
开始阅读
24
从大数定律到正态分布
如果我们向上抛一枚硬币，每一次硬币落下后哪一面朝上本来是偶然的。但我们上抛硬币的次数足够多后，达到上千次或者上万次以后，我们就会发现，硬币每一面向上的次数约占总次数的1/2。这种情况下，偶然中包含着必然。必然的规律和特性在大量的样本中得以体现。虽然随机事件单独来看无规律可循，但在大量重复出现的条件下，往往呈现几乎必然的统计特性，这个规律就是大数定律。通俗
待学习
开始阅读
25
正态分布与商品套利
首先，我们要回答第一个问题：套利商品之间的比价关系的变化是不是一个随机过程。套利商品之间的比价关系（以下简称比价）我们已经很熟悉了，是一个商品的价格与另一个商品价格的比值。比如，豆粕与玉米的比价＝豆粕价格／玉米价格。我们把这个比价看成一个变量，如果此变量以某种不确定的方式随时间变化，则称该变量遵循某种随机过程。人人都知道抛硬币的结果是一个典型的随机过程，
待学习
开始阅读
26
价值回归
如果把在市场中交易看成一个长期持续的游戏的话，有两种基本策略可以让我们赚钱。第一种方法就像抛硬币赌输赢，每一次的成功概率为50％，如果每次盈亏的金额相同，长期玩下去基本上不赚不亏打个平手。在这种成功概率之下，我们只有改变支付（支付是指参与者得到的期望效用水平）才可能获得理想的结果。还是拿抛硬币举例，假如每次赢的时候可得200元而输的时候只需支付100元，
待学习
开始阅读
27
谨慎与耐心
现在要开始交易了。科学家通过实验来验证自己的预测，投资人通过交易来验证自己的预测。通过投入和专注的研究，我们已经拥有了数据，发现了规律，并可以由此建立模型。如果不能将思维转化成行动，一切就都只是纸上谈兵。重点是，保持谦逊和信心，亦即保持谨慎和耐心。谦逊，就是始终认识到自己是无知和渺小的。人类还没有能力充分了解自然的核心规律，我们所能了解到的所有的
待学习
开始阅读
28
用概率计量风险
投资于风险证券的投资者总会担心亏损或业绩不佳。这很正常，我们都是损失厌恶者。除非我们把钱存入银行或购买确定收益的债券，这样的投资无风险，收益也不一定理想。假如想获得高于确定性收益的投资回报，那么就一定会面对风险。人们常说，风险越大，回报越大。这似乎告诉我们风险和回报是成正比例变化的。不过金融学家不断努力寻找方法，力求使得投资组合能够在风险最小化的前提下获得最
待学习
开始阅读
29
通过资产组合降低风险
假设投资者还拥有（哪怕是部分）理性，那么他们在两个资产组合之间选择时，会倾向于具有较高的期望收益和较低的风险（即较低的标准差）的资产组合。当我们称一个资产组合1（期望收益率为μ 1 ，标准差为σ 1 ）优于另一个资产组合2（期望收益率为μ 2 ，标准差为σ 2 ）时，说明资产组合1的期望收益高于资产组合2的同时风险却更低（即μ 1 ≥μ 2 且σ 1 ≤
待学习
开始阅读
30
无处不在的风险管理
有一点可以肯定，不存在没有投资、没有风险的利润。就像人们常说的，天下没有免费的午餐。风险和收益相伴相生，它们是同一事物的不同侧面而已。风险管理和收益追求似乎是相反的两个行为，但本质上它们都在为一个目标服务。因为风险管理的目的就是在风险限额内追求利润的最大化。这是经常被引用的巴菲特的一句话：“投资的第一条准则是不要赔钱；第二条准则是永远不要忘记第一条。”因
待学习
开始阅读
31
金融让生活更美好
每年都有数千名需要进行肾移植的病人因无法找到匹配的肾脏捐赠者而死亡，问题的根源在于几乎没有人自愿捐出自己的一个肾：移植手术本身就要承受巨大的痛苦，而且术后还有可能出现各种并发症。通常情况下，愿意捐献肾脏的人是近亲或者配偶，但是这些人通常又不能满足配型的需要。哈佛大学经济学院专门从事市场设计的教授艾文·罗斯，受数量经济学家劳埃德·沙普利等人设计的一个理想化住
待学习
开始阅读
32
为每一个人服务
2012年年末的一天，我受邀和朋友们一起吃饭，席间认识一位某大银行的干部。此人出场就非同一般，人未进门肚子先进门，落座后满脸堆笑，为人四海，一副老于世故的成功人士的样子。这位干部所在的银行可不得了，当年的净利润超过2000亿元，无疑是全中国“最赚钱的银行”，也是全球市值最大银行。它们有什么“法宝”呢？这位干部倒也直率，坦言道：这个“法宝”就是“赚穷人的钱
待学习
开始阅读
33
何为专家
高连奎在他2013年出版的《世界如此危机》一书中，是这样评论中国经济方面的专家的：“中国经济学家普遍专业知识水平低下。”他写道： ……很少的人士大力推广自己的一己之见，而且是知识越少越偏激，越偏激的言论越容易在舆论界胜出。而那些知识丰富的人反而谦虚不语。时间长了，社会上充斥的几乎都是偏激的言论，也就出现了知识界的“劣币驱逐良币”现象。他还指出，社会环境助长
待学习
开始阅读
34
刺猬与狐狸
刺猬属于A型性格的人，他们相信“凭一技之长而无穷”，认为自己掌控着世界的真理，认为自己就是万物的法则，切实保障着社会的运行。比如马克思和阶级斗争、弗洛伊德和潜意识，或是马尔科姆·格拉德威尔和“引爆点”等。而狐狸属于一种好斗的人，他们认为“千伎百俩而有尽”，解决问题有许多方法。他们对于琐碎、不确定、复杂或是有分歧的意见更加有耐心。如果说刺猬是猎手，总在不停地
待学习
开始阅读
35
道德因素
以上说的都是技术层面，但要证明一个专家真正值得信任，仅仅依靠技术层面来判断是不够的，另一个同样重要的因素是：道德水准。亚当·斯密在《国富论》中试图阐明一个道理，即每个人出于自利动机而选择的行为最终会给整个社会带来最高的福利。米尔顿·弗里德曼夫妇在其著名的《自由选择》一书中用更浅显易懂的语言、生动翔实的事实和简单直白的推理再一次强调了亚当·斯密理论对这个人类
待学习
开始阅读
36
结语
套利作为一种交易手段，其本质就是：寻找不完全相同，但又相互关联的资产之间出现的价值错配机会，当这种机会出现时，买入我们认为价值被相对低估的资产，同时卖出我们认为价值被相对高估的资产，并等待双方的价值回归，从而获得价差收益。这里所说的“不完全相同”的资产，可以是时间上的、空间上的或是资产属性方面的。而“相互关联”则既需要满足理论上的关联，又需要满足数学上的
待学习
开始阅读
37
附录一套利实践者一：提供稳定持续盈利空间——庆余投资的套利故事
C ＝100－100／1.08＋10＝17.41（元）假设市场上C 的价格是18元，说明买入期权的价格过高了，我们可以通过卖出买入期权，同时卖出与买入期权等价值的资产来套利。仍然是贵卖低买。从方程1-2给出的模型可以知道，要买入与买入期权等值的资产分为三个部分： 1．购买股票。支出为100元。 2．借入部分资金来支持这项交易。收入92.59元。 3．购买
待学习
开始阅读
38
附录二套利实践者二：《BOSS》杂志对作者章文先生的专访（2012）揭秘套利私募——访创意基金管理人章
当时，个别还有理智的金融专家发现，庞兹所套利的产品，那种明信片，其总发行量不足1万美元，如此的规模根本不可能支持他所宣称的交易，他给予投资者的所谓回报实际上是拿后来的“投资者”的钱给前面的“投资者”。于是金融专家站出来揭露庞兹的骗术。庞兹在报纸上发表文章反唇相讥。民众已经失去了判断力，他们更愿意相信奇迹和带给他们美好憧憬的煽动者，仍源源不断地向庞兹“投资”。
待学习
开始阅读
39
参考文献
套利能够在无风险的前提下获得几乎是确定的利润，这一过程就像阿里巴巴种金子。但是，这个过程不会持续很长时间。套利者所赚取的利润将吸引大量资金对价格差异的关注，其他套利者将会为同样的套利利润展开竞争，结果是价格差会被填平，等同资产之间的价格将趋于一致。正是由于这个原因，一价定律常被用在给金融资产定价。其代表人物是斯蒂芬·罗斯，他是风险测量领域的先驱者之一。19
待学习
开始阅读
40
致谢
如果职业套利者面对我们例子中的三种汇率——1日元兑换0.01美元、1英镑兑换200日元和1英镑兑换2.10美元，他们可能通过在日元市场上将200亿美元换成100亿英镑，同时在英镑市场上出售100亿英镑换取210亿美元，寻求赚取随即产生的10亿美元利润。实施这种大规模交易的尝试将立即引起注意，而且随后的交易将消除这种价格差异。因此，给定以美元的日元价格（1日元
待学习
开始阅读

Reader

章节阅读

Local EPUB Text

大脑与不确定性（二）：神经经济学

定义目标

玛尔曾经指出：“通过搞清楚需要解决问题的本质来理解一种算法，比通过研究使该问题被体现的机制（及硬件）更为快捷。”而进化论提供了这样一个模式，它指出所有行为的最终目标只有一个——最大化生物体的内在适应度。

在整体意义上，可以认为神经系统的功能就是依托进化适应度进行决策。即便是笛卡儿提出的反射，也可以被看作是神经系统在面对一个很简单的、为生物体确定一个明确目标的问题时作出的决策。

你打过台球吗？这类游戏是确定性数学的经典例子。因为我们假设白球处于具有可预知性的牛顿体系之中，并且我们具有关于那个世界状况的完全的知识。在这些约束下，我们就可以用简单的确定性方程计算出最佳的运动反应。但是，这可能不是神经系统必须面对的具有典型性的决策。

设想白色的台球对周围世界仅具有有限的知识，而且只能看见球桌上距离自己一尺范围内的色球。这样的话，知识的不完备会使确立最佳反应更加困难。在存在较大不确定性的任何领域，不管确定性工具是多么先进，它们都不可能确定出最优反应。

如果对确定性世界具备完全知识，那么要明确计算目标就相当容易，但真实的情况是我们对现实世界的状态很难完全了解。所以选择某种运动反应（作出决策），从而最大化不确定条件下的适应度就成了神经系统所面临的真正挑战。

台球世界中认识论的不确定性

这一问题要求数学家和生物学家发明一些工具，从而可以用来设计不确定问题的解决方案。

概率论的诞生

掷一个共有6个面的骰子，虽然我们事先并不知道骰子落地后哪一面会朝上，但是却知道2点朝上的概率为1/6。不过，在启蒙运动之前这并不是一个人尽皆知的道理。虽然早在古代，人们就开始玩掷骰子以及其他靠运气定胜负的比赛了，但直到17世纪，不管是数学家还是平民百姓，都不知道如何正式地描述、量化或预测不确定性事件。

概率论这一数学分支学科首先被一名年轻的数学家（他还是物理学家、哲学家和散文家）发展起来，这个人就是布莱兹·帕斯卡（BlaisePascal，1623年6月19日—1662年8月19日）。

布莱兹·帕斯卡

帕斯卡生于法国克莱蒙费朗，3岁丧母。他的父亲艾基纳·帕斯卡是一名小贵族和当地法官，对科学和数学具有很大的兴趣。帕斯卡青年时期展现了杰出的数学才能，16岁就发表了一篇关于圆锥截面的论文。在25岁前，他已经开始着手对解决不确定事件的数学方法进行研究了。

1653年9月，帕斯卡受邀与几位绅士结伴旅行，他们分别是罗尼兹公爵（帕斯卡的资助人）、梅雷爵士和明顿绅士。旅途中，梅雷爵士向帕斯卡提出了一个赌博难题，即所谓的“赌金分配问题”。这一问题说的是，两个人采用连续掷硬币的方式来赌博，每个人的赌资是50个金路易。如果首先有4次硬币正面朝上，则梅雷爵士赢得全部赌注100个金路易；如果首先有4次反面朝上，则罗尼兹公爵赢得全部赌注100个金路易。但是连续抛5次硬币之后游戏突然被中断了，此时出现了2次反面，3次正面。也就是说差一次正面梅雷爵士就将获胜，而罗尼兹公爵再有2次反面也将获胜，那么此时应该怎样分配这100个金路易。

现在，这个问题看起来真是简单至极：接下来抛硬币时会出现两种可能性相等的结果：正面朝上，则梅雷爵士获胜；反面朝上，则是平局，必须再抛一次。此时每个参与者获胜的可能性相等。总的来看，梅雷爵士有75％的机会获胜，而罗尼兹公爵为25％，所以他们应该按75/25这一比例分配赌金。虽然这种逻辑显而易见，但是对于梅雷爵士和他的朋友来说，这一逻辑在那时是不可知的，甚至是不可想象的。

帕斯卡对这个问题似乎很着迷。他希望不但可以解决这个问题，而且要发展一种基于经典几何学的数学方法来解决与这一问题相类似的一般形式的问题。

帕斯卡的研究方法与现代的方法有所不同，因为当时还没有“概率”这个概念，而只有“机会”这样的说法。于是，他把所有事件全部简化成一套确定的结果或者均等的机会。在此基础上，帕斯卡推出了一组公式，这组公式可以描述等概率事件是怎样进行组合，从而产生不均等的复合概率。正是概率既可以组合又可以比较这个观念使得西方思想界发生了根本的变革。

帕斯卡有着深刻的洞察力。他认为对概率论的理解不仅仅会影响到数学的教学和风险的计算，而且必定会影响到从神学到人类决策的所有事情。概率论必将对人类决策产生影响，这一认识大概是帕斯卡的最大贡献了。

在帕斯卡去世后才出版的（1670年）著作《沉思录》中，他提出了现在被称为“上帝存在性”的帕斯卡赌注：

“上帝或者存在，或者不存在。”我们会倾向哪一个呢？那些（基于确定性数学工具的）逻辑推断不可能解决这一问题……旋转的硬币究竟会倒向正面还是反面呢？你赌哪个？那些（基于确定性方法的）逻辑推断不可能作出选择，也不可能进行证伪……

但是你必须赌，必须作出决定，别无选择。那么你会选哪个呢？我们来看看，既然必须作出选择，那么看看哪个给你的利益最小……这个游戏中，如果正面表示上帝存在，我们可以衡量一下得失。我们可以对以下这两种情况评估一下：赢则全得，而输却无所失，那么不要犹豫，赌上帝存在。

“但是如果（要放弃一生的罪过），这样的话我也许赌得太大了。”我们可以想想，因为得失机会相等，如果你拿地球上缺乏道德规范的一生去赌具有上帝赐福的两辈子，那么你就可以一搏（即使你并不确定怎样选择），但是如果你赢得是上帝赐福的三辈子呢？……如果你迫于无奈必须选择，在得失相等的游戏中你不冒生命危险去赌上帝赐福的三辈子是不明智的。但那毕竟有来世的生命和幸福，如果真是这样的话，即使机会无限，只要其中有一个使你受益，那么赌一次仍然是正确的选择……因此在得失机会相等的游戏中，如果赌注（或可能的损失）是有限的但所获得的奖励是无限的时，我们的论据就具有无限的分量。

帕斯卡的思想在整个欧洲产生了巨大的影响。他的朋友及其周围的人意识到，比起微积分的发明，帕斯卡在不确定性或随机世界所做的事情毫不逊色。帕斯卡试图弄明白怎样将对得失的估计与对未来事件的可能性的估计结合起来，从而确定何种行为方案可以产生最优结果。

帕斯卡的朋友安托万·阿尔诺说：“我们从中得到的主要收获是：它们可以使我们更加理性地看待希望与恐惧。”

将价值同概率结合起来

20世纪前半叶，概率论成为估计具有不确定结果的未来事件可能性的工具。由于它赋予了未来事件的可能性以数字形式表达的值，所以对于解决如何选择不确定条件下的最优结果这一问题，概率论取得了巨大的成功。

在此基础上，帕斯卡和阿尔诺又进行了进一步的研究。他们开始将关于事件可能性的信息同该事件对选择者的价值结合起来思考。帕斯卡完成这一结合的公式很简单：把某事件的概率同用货币（比如金路易）表示的该事件的价值相乘，通过这种方法求出预期值。于是，最优化决策就可以简化成这样一种能够确立可产生最大预期值的行动方案的技巧。

需要注意的是，这种方法仅仅是核心发现之一，它并不是现代经济理论建立的基础。随着预期价值理论被广泛应用和理解，瑞士数学家约翰·伯努利的儿子尼古拉斯·伯努利首次对从这一理论推出的奇怪悖论进行论述。这就是上文介绍过的圣彼得堡悖论。

18世纪早期，这个被人们所了解的圣彼得堡悖论成了概率论研究中的一大热点。直到1738年，这一悖论才被尼古拉斯的弟弟丹尼尔·伯努利解决。

丹尼尔认为预期价值理论这种观点向人们提出了不合理的要求，它暗含地假定人们对风险无动于衷。让我们来考虑一种典型情况。想象一下，现在你饥饿难耐，而且此时已经很晚了，如果现在你有两种机会可以选择：一种是100％的可能性赢得50个土豆条；另一种是有50％的可能性赢得100个土豆条。面对这两种情况，大多数人一定会选择肯定赢得50个土豆条的机会，而不愿冒险以至于一无所获，继续流浪。我们可以通过增加获胜概率为50％的抽奖法的支付，直到人们发现两种抽奖对他们来说具有相同的吸引力，从而评价人们对风险的厌恶程度。100％的机会得到50个土豆条与50％的机会得到多少个土豆条具有相同的吸引力呢？150个？200个？还是400个？通常大多数人表示，比起肯定可得50个土豆条的那个游戏，他们稍稍偏爱于有50％可能性得到200个土豆条的那个游戏。正如伯努利所提出的，在心理上200个土豆条的价值大概相当于50个土豆条的两倍。

现在让我们作进一步探讨：减少这两个抽彩给奖法的支付价值。在100％可得到5个土豆条和50％可得20个或者15个或者12个土豆条的这些抽彩给奖法中，你会选择哪个？对于50％可得12个土豆条的赌局和100％可得5个土豆条的赌局，几乎所有人都一样中意。虽然在心理上200个土豆条的价值只是50个土豆条价值的两倍，但是12个土豆条的心理价值却是5个土豆条心理价值的两倍。伯努利指出了这点，并得到结论：任意所得在心理上价值的增长速度慢于数学上价值的增长速度。

与丹尼尔·伯努利同时代的德国生理心理学家韦伯也通过研究发现这一现象：人们感受到的差别的不同量之间的绝对差并不是恒定的。他以感知重量为例，人们能分辨出10克与11克之间的差别，但是却分辨不出1000克与1001克之间存在着的差别。

另外，丹尼尔还发现：比起那些一无所有的人，富人（在上面这个例子中指那些拥有几袋土豆条的人）更愿意冒险。

对于丹尼尔来说，这些观察结论都显示了这样一个道理，即所得的心理价值同所得的数学价值是两个不相同但又相互联系的概念。他指出人们在作决策时，总是先估计那部分价值使自己当前状况改善的机会有多大，而不是这部分的绝对价值。在此基础上丹尼尔创造了一种将价值与效用联系起来的简单形式，利用二维平面图就可以表示两者之间的关系（参见图2-2边际效用递减）。这就是效用理论。

概率论的进步

18世纪中期之前，概率论（显著地不同于评价理论——如预期效用理论）几乎全部集中于对诸如赌博、投硬币、预期寿命等这些具有不确定性的未来事件可能性的估计上。这类可能性估计常被称为“偶然概率”。

准确地说，偶然不确定性事件指一种可能性事件，帕斯卡曾预言它将成为“概率论的算法”的研究主题。不管世界是否真正具有确定性（就像笛卡儿和伽利略所希望的那样），我们通常不知道将来会发生什么。

但是，有两个人意识到，概率论不仅可以用来估计未来事件的可能性，而且还可以对过去事件的可能性进行估计。虽然这一点看似微不足道，但是却改变了欧洲人对概率数学的思考方式，同时也为更加正式的决策理论开创了新局面。这两个人是英国牧师托马斯·贝叶斯和法国数学家皮埃尔·西蒙·拉普拉斯。

托马斯·贝叶斯

当时一位天文学家短时间内连续6次对木星的地平纬度进行测量，从而得到6个不同的值。木星有唯一的地平纬度，但是我们却得到了6个并不完全准确的值，且各不相同。我们可能要问，哪个才最有可能是木星的真实地平纬度呢？正是由于托马斯·贝叶斯（Thomas Bayes，约1702—1761年4月17日）的发现（在他去世后于1763年成书出版）才使得概率论能够回答这类问题。

贝叶斯认为，如果知道了由天文学家的仪器所引起的误差的分布，那么就可以在数学上推出最有可能的木星的真实海拔值了。有一点需要指出的是，这类概率不存在任何偶然的成分。因此在进行测量时，木星肯定有一个真实的海拔值。不确定性仅仅源于我们知识的不足。在这个例子中，我们所面临的限制全部都是认识论上的。此外，贝叶斯还指出，概率论不仅可以用来描述偶然的不确定事件，还可以用以描述认识论上的不确定事件。

贝叶斯的见识相当深邃。他意识到，我们对很多事情仅具备不完全或不准确的知识，所以尽管有些事情真的发生了，但是由于我们知识的有限性，使得它们仍然具有不确定性。

贝叶斯定理为解决这类认识论上不确定性的基本统计方法奠定了基础。贝叶斯定理通过下面的方法做到了这一点：在给定某人有效的观测结果的情况下，它将对世界所有可能的过去状态的概率预测过程置于严格的数学基础之上。

人们对贝叶斯的生平知之甚少，只知道他是一位生活在乡下的新教神学家。他生前只有两部著作：一本是神学著作《神的善行》；另一本是数学著作《流动学导论——数学家针对分析学家异议的辩护》。贝叶斯去世之后，他的朋友，也是他遗嘱的执行者理查德·普莱斯在其论文中发现了一篇名为《论如何利用或然性理论解决问题》的手稿。普莱斯于1763年将这份手稿交给了皇家学会，凭借这份手稿，贝叶斯获得了巨大的声誉。

虽然贝叶斯已经得到了一种可以对过去事件的可能性进行计算的最佳方法，但是拉普拉斯对此并不知情，他在1772年开始对逆概率产生兴趣。他在对天体力学孜孜以求的同时，也对现代概率论的发展作出了很多贡献。

拉普拉斯认为，未来的不确定性并不存在根本的偶然性，存在的只是对过去和未来在认识论上或多或少的不确定性。从这一基础出发，他也尝试建立一个最优的估计过去和未来事件可能性的体系。

正是由于贝叶斯和拉普拉斯，现代概率论和决策理论才得以诞生。

概率、价值、决策和进化

从进化论的角度讲，神经系统的目的必然是为了作出能够最大化生物体内在适应度的决策。如果我们知道运动反应与内在适应度是怎样联系的话，那么为了确定最佳运动反应，把感觉信息与已知的环境结构现状结合起来的最佳方法是什么呢？

帕斯卡、伯努利、贝叶斯和拉普拉斯等人从现代经济学理论的角度回答了这个问题。从进化论的角度来讲，要明确这一目标需要计算生物体的每个可能的行动方案的效用值。然后利用贝叶斯定理对每个结果的概率进行估计。把这些数据点组合起来，就可以确定任何既定情况下的最优运动反应了。

从20世纪50年代开始，行为生态学家就试图建立描述最优行为策略的量化模型去理解动物为什么按照我们观察到的方式采取行动（例如，动物为什么会选择一种食物而非其他，为什么选择这个配偶而不是另一个）。

他们认识到，在不确定的世界中，有效的解决办法只能通过概率理论来描述。因此这些科学家把经济学工具作为工作的起点，以经济学为基础的理论在行为生态学的研究中随处可见。

古典经济学与行为生物学融合的思想方式最早出现在1966年同时出版的两份里程碑式的报告里：麦克阿瑟和皮安卡的《关于混杂环境的最优利用》和艾姆伦的《时间和能量对食物偏好的影响》。艾姆伦在他的报告里指出：

我们可以假定，在特定物种肉体和神经的限制范围内，自然选择将通过影响的方向和强度促进能够最大化每个个体在单位时间里卡路里摄入量的进食偏好的发展（不管以哪种方式——先天的或者是后天形成的）。

在这个思想的基础上，华盛顿大学的艾里克·恰尔诺夫和戈登·奥里安通过对动物收集食物过程的观察得出这样的结论：所有觅食动物的目标，都是有效地收集食物。这就意味着，原则上所有动物都必须以尽可能少的能量支出收集尽可能多的食物，并且建立了一个“捕食模型”。

在恰尔诺夫的概念中，觅食过程就是这样一个循环：搜寻、遇见、决定、搜寻、遇见、决定……捕食模型的目的就是描述作出决策的过程：决定吃这个猎物还是继续搜寻其他猎物。恰尔诺夫认为，为了有效地作出这个决定，觅食者必须了解关于每个潜在猎物的四个方面的信息：

1．吃掉这种动物的一个典型个体所能获得的能量。对于狮子来说，这相当于知道一头水牛的肉是疣猪的20倍。

2．捕获和消费这种类型的猎物需要花费的平均时间，也就是处理时间。对于狮子来说，则是从捕捉猎物到吃掉猎物这段时间。

3．处理过程中消耗掉的能量成本。显然，比起捕食一只疣猪，狮子捕食一头水牛所消耗的能量肯定要多很多。

4．每天发现各种类型的猎物的概率。

通过系列计算，恰尔诺夫得到了度量某一组给定的攻击策略在单位时间内可获得多少能量的标准：

得益于微积分的发明，这些数学生物学家可以把事情做得更漂亮一些：他们能够直接计算出哪种具体的攻击策略可以使能量摄取率最大化。在对以上等式作一下微分处理后，就可以得出一个新的等式，然后用它来计算出能够最大化R 值的捕食策略。

在得到了一个新的经过微分处理的等式后，一个有趣的并且出人意料的观察结果就出现了。为了能够最大化能量摄取率R ，一种特定猎物被攻击的概率应该是1或者0，即觅食者要么总是攻击这种特定类型的猎物，要么从来不攻击这种特定类型的猎物，这个观察结果被称为0—1规则。在任何情况下觅食者都不会出现有时攻击有时不攻击某种类型猎物的情况。

那么，觅食者应该攻击哪些类型的猎物呢？模型表明，如果捕食这种猎物所获得的能量除以处理时间（即捕食这种猎物的净能量获得率），小于遇见其他猎物的概率乘以从其他猎物中所获得的能量摄取率，那么就绝对不应该攻击这种猎物。也就是说，只有当攻击这种猎物的价值高于搜寻其他更好的猎物的价值时，觅食动物才会攻击这种类型的猎物。

捕食模型需要实验的检验。恰尔诺夫和他的同事设计了一个用山雀为实验对象的捕食实验。

在一个人为的觅食环境中，给山雀两种价值已知的猎物类型：大幼虫和小幼虫，大幼虫是小幼虫价值的两倍。猎物由一个传送带移动到山雀所在的笼子内，笼子内的山雀并没有看见猎物放置的过程。

按照0—1规则，动物认为某个类型的猎物值得吃，就总会吃它；如果认为不值得吃，就永远不会吃它。但是，令人惊讶的是这与实验者观察到的结果不符。虽然这些山雀具有选择性，但是所吃的幼虫中只有约85％是大幼虫，而不是理论上预计的100％。显然，山雀没有按最优策略来择食，而是采用一种次优策略。

不过，如果我们换个角度来思考，山雀的行动可能是最优的，而数学模型则可能存在一些错误。在现实世界里，猎物的价值是会改变的，而山雀的神经系统也会认识到这个事实。因此这些山雀会不时地挑选小幼虫，假如将检验捕食模型的实验环境扩展为整个全球环境，这将是最优的策略。

不可简约的不确定性

除了我们认知局限导致的不确定性外，还存在另一种事实存在的不确定性。

我们再次借助台球桌案例。这一次，考虑一个与我们生活世界相像的台球桌世界。假设台球桌上随机放着一个充满智慧的白球，并假设该白球的视野是有限的（白球在认识上具有不确定性），再假设除了白球以外的其他球都有自己确定的位置，而且其他的色球和白球一样拥有智慧，它们并非是被动的环境因素，而是和白球一样，目标也是将桌面上其他的球清理干净，在这个意义上，它们都是相互的竞争者。

如果一个黑球位于球袋的前面，并且出现在白球的视野中，白球经过详细数学分析得出结论：最优策略是尽快将黑球击入球袋。同时，黑球也知道了白球的想法。那么，面对这种情况，黑球该如何取胜呢？

只要黑球采取了确定的策略，无论多么复杂，白球都能够（至少理论上如此）推断出这个策略，并采取相应的策略击败黑球。黑球只有一个策略，它的行为必须不可预测。如果黑球前进的方向是不确定的，那么白球就不一定能够击中它。只有增加一种随机因素，给对手一种无法消除的不确定性，才是黑球对它的竞争者采取的最优策略。

对这种（通过行为随机性引入的）不确定性的认识对理解行为、大脑和意识之间的关系极为重要。

博弈论

古典经济学理论从未考虑过面对智能型对手时的决策制定。当面对一个智能型对手时，我们不仅受到来自静止世界的影响，还受到来自竞争者所采取的行动的影响。这是由于在一场真正的两人竞争中，你和对手的行为组成了一个动态系统。我们不可能用古典经济学方法来理解这种动态系统及其包含的不可简约的不确定性。

20世纪40年代，普林斯顿的数学家约翰·冯·诺依曼和经济学家奥斯卡·摩根斯坦对古典经济学的这种局限性产生了兴趣。他们将发生在智能型竞争者之间的相互作用叫作“博弈”。

引起冯·诺依曼和摩根斯坦特别兴趣的是一类名叫“混合策略零和非合作博弈”的数学博弈。博弈论建立的基础正是非合作博弈，这主要是由于零和概念的简单性。

在零和游戏中，一个选手的获益总是严格等于另一个选手的损失，在任何可能的结果中，选手总的损失和获益为零。在选手之间的这种完美对称性简化了很多博弈论所涉及的复杂数学问题。

冯·诺依曼和摩根斯坦的研究一直专注于寻找零和博弈的最优解。但是到了20世纪40年代晚期，人们逐渐认清了这种做法存在很大的局限性。在多种博弈中，一个博弈者的获益在数值上并不等于另一个选手的损失。这些非零和博弈，尤其是那些包含混合策略的博弈，是非常难以解决的。

为了理解这些博弈如此重要的原因，以及为什么它们需要一种特殊的解法，让我们来考虑一下大家都很熟悉的斗鸡博弈。史密斯和琼斯分别坐在桥两边的车中，收到信号后，他们以最快的速度相向行驶。当两辆车就要相撞时，史密斯和琼斯都要决定是继续行驶还是改变方向。假设斗鸡游戏的策略形式如表3-3。

表3-3　斗鸡博弈

史密斯继续行驶史密斯改变方向

琼斯继续行驶－100，－100 50，－10

琼斯改变方向－10，50 1，1

如果史密斯和琼斯都没有改变方向，那么他们的车子都会被撞烂——根据冯·诺依曼的方法，我们给两个选手的损失赋值为－100。如果其中一个人选择转向，那么我们将转向者的损失表示为－10，而另一个人则有50的收益。最后，如果两个选手都转向，我们则认为出现了平局，两个人都没有获益。

那么，我们应该如何理解这个博弈呢？在理想状态下，我们想要知道史密斯和琼斯的最优策略，但是由于这个问题不是零和问题，那么冯·诺依曼的公式对于我们来说几乎没什么帮助。如果两人都选择继续行驶，那么他们都会遭受明显的损失；如果一个人选择转向，那么另一个人的收益远远高于转向者。因此，这个博弈中并不存在收益和损失的零和状态。

20世纪40年代后期，约翰·纳什（John Forbes Nash Jr.，1928年6月13日—　）是普林斯顿大学数学系的研究生，当时这里是第二次世界大战后数学界的中心。当纳什渐渐成为20世纪最伟大的数学家之一时，爱因斯坦和冯·诺依曼都早已成名。纳什寻找博士论文题目的时候，发现了非零和博弈的一个有趣的结构。让我们从纳什的角度观察斗鸡博弈，以便了解他是如何使用预期效用概念和均衡理论来克服冯·诺依曼的局限性的。

纳什发现，如果琼斯和史密斯一次又一次地进行斗鸡博弈（为了进行数学分析，忽略他们死去的可能性），那么两个人的行动必然会达到某种均衡。在这个均衡点上，两个人的得失相等，并且两个人都没有变化的动机。

通过数学计算，纳什得出史密斯转向的概率是64.7％，在这个概率下，琼斯采取哪种行动都无关紧要。如果其中一方博弈者采取一种次优行为（比如琼斯声称的，不管怎样他都将直走），那么另一方博弈者面对的将是一个标准的经济学最优方法，该问题可以用标准方法轻松解决。但是，只要双方同时寻求最优方法，那么他们就必须达到均衡点。用这种方法计算的均衡点定义了唯一的一种行为方式，即既不选择突然转向，也不选择继续行驶。在这个点上，博弈双方达到均衡。

这种博弈被称为均衡博弈，因为对于博弈双方来说，博弈公式所描述的均衡点是相同的，博弈的损益也是对称的。

正如纳什所证明的，对于每个博弈者来说，描述均衡策略的公式是不同的，因此每个博弈者的均衡点也是不对称的。由于纳什均衡可以扩展到非对称博弈，因此他能够证明，本质上这类问题的所有博弈都有一个均衡点。

这种方法被称为纳什均衡。用通俗的话来说，纳什均衡是指一个不会令人后悔的结果，不管他人怎么做，各方对自己的策略都很满意。

纳什的观点影响深远，他将博弈论转向了对均衡点的研究。哪里才是一个博弈可达到的最优均衡点呢？纳什的方法使我们可以回答这个问题，而纳什本人也由于这个重要的发现获得了诺贝尔经济学奖。

纳什的均衡方法告诉我们，如果我们与对手有相似的目标，并且希望达到最好的结果，那么我们应该采取怎样的策略。

当然，在实际中，史密斯和琼斯可能提前并不知道对方的策略矩阵。对于他们来说，这是一个非常重要的问题，因为他们可能只有一次机会。在其他形式的此类博弈中，进行同样的重复博弈是完全有可能的。我们可以考虑这样一种情况：通过系统地研究琼斯的选择并且持续地调整自己的选择，史密斯可以保持自己的优势，直到他们两人达到均衡点。但是对于一次博弈，在实际中确定纳什均衡就相当困难了。

当前，博弈论的第二个重要局限是它无法告知我们在真实世界中，史密斯和琼斯应该如何寻找均衡点。博弈论可以描述一个达到静态均衡的系统，但是不能有效描述系统达到均衡的动态过程。这是一个重要的局限，因为动物的大部分行为必须用来解决动态问题——对于这些问题我们尚缺乏足够的理论工具。

《美丽心灵》这本书以及赢得奥斯卡金像奖的同名电影就是描述约翰·纳什的一生。当我写到这一段的时候，我又重看了一遍这部电影，我喜欢这部电影，因为它并不是描写纳什如何获得学术上的成功，而是和每一个普通人都要面对的问题一样，如何战胜自我。

伟大的人物拥有美丽的心灵，如果缺乏一颗美丽的心，无论在物质和权势上获得了多么大的成就，他都与伟大毫不沾边。在这个意义上纳什真正成功了，其人性的光辉超越了他在思想上的成就。这才是人生价值和意义的所在（也许对于现实中的个体来说，追求精神世界的自觉相比追求物质条件的满足来说是一种次优策略，但对于人类整体的进步和优化，这未尝不是最优的策略）。作为渺小但同样拥有去战胜自我缺陷的权利和勇气的我，为此鼓掌！值得尊敬的您呢？

生物学与博弈论

在恰尔诺夫应用经济理论的同时，进化论生物学家约翰·梅纳德·史密斯也想知道博弈论是否可以成为生态生物学家的有力工具。他在1982年出版的著作《进化论与博弈论》（与玛尔的《视觉》出版于同一年）的序言中写道：

荒谬的是，博弈论被更多地应用于生物学研究，而非它的设计初衷——经济学行为。

梅纳德·史密斯介绍了生物学博弈中最有名的鹰鸽博弈。

鹰鸽博弈是这样开始的：一个没有领地的动物侵入了另一个动物的领地，并且对其领地产生了威胁。随后，双方都必须作出决定，是使冲突升级（为领地而战），还是选择退让（不经战斗就将领地拱手让出）。假设某一方选择战斗，表现得像鹰一样，而另一方表现得像鸽子一样选择退让，那么鹰就会拥有领地控制权。如果双方都表现得像鸽子一样，那么就随机地选择一方拥有领地。最终，如果双方都表现得像鹰一样，那么它们就必须决斗。其中的一方会受伤，并且因此而减少它可以繁殖后代的数量，而另一方则会获得领地。这个简单的博弈可以由以下的策略矩阵表示（见表3-4）。

表3-4　鹰鸽博弈

对于梅纳德·史密斯来说，每一个变量都可以用进化论术语来表达：不同的结果中每个个体在繁殖适应性方面的得与失。获得领地可增加适应性，受伤则减少适应性。用这种方法可以总结出，如果领地价值很高，并且鹰与鹰在决斗中受伤的程度很低，那么基因上趋向于像鹰一样行为的动物就比像鸽子一样行为的动物更具有适应性。在这些条件下，梅纳德·史密斯认为，动物种群会向显示单一的纯策略均衡的一类物种进化，即最终所有的动物都会是鹰。

相似地，如果领地价值很低，而且鹰与鹰在决斗中受伤的程度很严重，鹰类则会逐渐消亡。所有鸽子一样行为的动物会繁衍更多的后代，会比鹰类动物更具有适应性。在这些条件下，种群会像鸽子一样显示纯策略行为的物种进化。

但是，如果领地价值很高，而且受伤的损失也很大，那么就会出现一种有趣的结果。在这些条件下，进化的唯一稳定的均衡策略就是在每一次遭遇时，每一个个体都按照固定的概率选择做鹰或鸽子。

更具体地说，从进化的角度来看，在进行鹰鸽博弈的种群中应该现出一种主导性的占优策略。在给定的条件下，动物在发生遭遇时表现得像鹰一样的概率等于领地的价值除以在鹰—鹰搏斗中受伤损失的价值，这样种群将会达到一个进化的均衡点。

梅纳德·史密斯认为个体之间以及个体行为的不可预测都可以通过某种进化论方式形成。他指出，第一，利用博弈理论的研究结果表明，在微观水平上，动物的行为必须是随机的、不可预测的，而在概率层面上则是合理的、可预测的。第二，这些复杂的不可预测的动物行为类型可由博弈论得到合理的解释。

博弈论仅仅要求每个个体的行为对于他的对手来说含有无法消除的不确定性，它并不要求动物行为从本质上来说都是不可预测的。有这一方面的证据吗？

1982年，哈珀在英国剑桥大学进行了一项针对鸭子群体觅食行为的研究，这项研究现在被视为该领域里的一个里程碑。

1979年冬天，33只野鸭游弋在剑桥大学植物园内的湖面上。哈珀想通过陆续扔给它们一些小面包球，来了解这些鸭子是如何竞争的。哈珀和他的一个助手每天都带着装有2克或4克面包球的篮子来到湖边，他们会在距离湖边20米的地方选择好各自的位置。看到信号后，他们开始向湖中投掷面包球，其中一人每5秒钟投一次，另一个人每5秒钟或每10秒钟投一次。哈珀的问题是，这33只鸭子将如何选择它们各自的位置？

考虑这样一种情形：哈珀每5秒钟投掷2克面包球，他的助手每10秒钟投掷2克面包球。那么，鸭子会有怎样的反应呢？表面上，这是33只鸭子的博弈，我们可以将它看作是有33个博弈者参与的纳什均衡问题。为了简化这个问题的数学解，可以有如下两个简化假设：第一，把它看作只有两个参与者的博弈：一只鸭子对一群鸭子。有33个参与者的情况下，也可以得到相同的结果，虽然复杂程度会大大增加。第二，不管是在哈珀面前还是在他的助手面前，所有的鸭子都有相同的机会得到掷出的面包球。

为了确定这个博弈的纳什均衡点，可以把被研究的这只鸭子称为史密斯，现在必须确定什么时候史密斯认为待在任何一个面包球投掷者面前没有差异，就必须找到史密斯的均衡点，在这一点史密斯会认为待在哈珀和他的助手两个面包投掷者面前的价值是相等的。

为了找到这一点，需要先定义每一片水域（水域的价值＝收益／鸭子数量）。之后通过数学计算可知：对于史密斯来说，当2/3的鸭子位于哈珀的水域，另外1／3的鸭子位于他的助手的水域时，两片水域的价值是相等的。只要不是这种情况，对于史密斯来说最佳的选择是去和更少的鸭子争食。正是通过这样的方式，每一只鸭子的博弈决策促使鸭群达到均衡点。

以上所有的分析表明，当2/3的鸭子游弋在哈珀的面前，而1/3的鸭子游弋在他的助手面前时，此博弈可达到纳什均衡点。在这样的条件下，史密斯认为待在哪个喂食者面前都没有差异。

既然这是一个对称博弈，那么对于其他鸭子来说，只要包括史密斯在内的鸭群将2/3的时间花费在哈珀的面前，而将1/3的时间花在他助手的面前，那么它们也会认为在哪一片水域进食都没有差异。

令人惊奇的是，这恰恰就是哈珀观察到的结果。在这种情形下，鸭群按照理论预测的纳什均衡点进行了精确的划分，并且这种划分在开始投掷面包的60秒钟内就完成了，而在这个时候至少有一多半的鸭子还没有吃到面包球。更令人惊奇的是，每只鸭子也按照1/3或2/3的比率分配它们在两片水面的时间，又和理论预测的结果完全吻合。无论哈珀和他的助手怎样改变投掷面包的数量或速度，鸭群都会按照前面的公式迅速配置在每一片水域的数量。

博弈论确实相当有效，不但可以在理论上为不可预测的行为构建模型，而且还可以预测动物在竞争中的真实行为（至少是近似的）。它的缺陷是不能提供一种合适工具，来说明达到均衡点的动态过程。

神经经济学

在这一系列对人类认识的基础上，一门交叉的学科——神经经济学出现了。神经经济学研究的最终目的就是理解大脑是如何产生行为的。

神经经济学家认为，以概率论、博弈论和经济学理论为基础的模型是联系大脑活动与行为的有效工具（到目前为止，这是研究神经经济学理论的一个构建方法而不是理论最终的样子）。

现实中的动物要幸存下来，它们没有（实际上也不可能）以确定性方式解决所有问题。相反，动物体肯定至少有两类不确定性：一类是基于动物所面临的认识论上的不确定性；另一类是需要同其他生物进行有效竞争的不可简约的不确定性。

首先，从认识论的角度来看，动物（包括我们人类）通常对于周围的世界只具有不完全的信息，因此它们必须对周围世界的可能状态以及它们行为的可能结果作出统计的估计。

所有基于经济学的理论都有这样一个前提假设：动物可以学习和描述它们周围环境的先验概率，并且可以将这些先验概率储存起来以备将来之需。神经经济学家要做的事是用神经经济学方法找到这种假设的生理实验证据。比如，至少对于某些种类的记忆来说，可以在动物的学习工程中，在可识别的大脑结构中得到更新。

神经经济学家作了多种试验尝试，也可以说成绩斐然。1998年，乔希·戈德和迈克尔·谢德林关于猴子对视野中移动光斑的感知判断所做的实验观察发现，当猴子注视显示的光斑时，大脑里正在进行一种类似贝叶斯法则的估计运算。保罗·格莱姆齐和迈克尔·普拉特对位于脑顶皮层中的确定性决策的研究也支持了这一假说。

实验方法也用在了理解动物如何学习估计它们特定的反应所能产生的价值。弗莱堡大学的沃尔弗兰·舒尔茨通过研究大脑神经细胞的多巴胺神经元以及大脑内侧皮质区来探索这一问题。在现在广为人知的一系列实验中，舒尔茨发现这些多巴胺神经元可以传输一种信号，这些神经元激发潜在活动的比率反映出动物对价值的预期（有学者发现，人类头脑中多巴胺神经元对信息刺激而产生的活动模式，与股市中消息给股价带来的波动模式几乎一致）。

另一方面，对于不可简约的不确定性，神经经济学家认为无论什么时候，动物作出的决策一定会受到拥有智慧的竞争者的影响，博弈论可以用来描述这个生物体所面临的可计算问题。

经济学模型描述动物和人类在需要作出决策时所面临的任务，以及其决定应该怎样去解决问题。真实世界中的动物和人类的行为存在着偏差，它们的表现只具有次优性。也许这正是理解博弈论可以用来描述生物体行为的最好证据。

神经经济学方法允许既能够分析又能够产生不确定性的模型。这种类型的模型以及由它们得出的经验数据，不仅仅对于研究大脑来说至关重要，对于研究人类行为的经济学来说，也具有高度的重要性。生物学家威尔逊在1998年提出，社会科学与自然科学相融合是不可避免的，同时也是必要的。这种融合首先表现为人们普遍认识到经济学和生物学是研究同一主题的两门学科。