Local EPUB Text
第六章 监管机制
“你需要的不是一支庞大的军队,而是一支特警队。”
英国前首相布莱尔的经历告诉我们:给复杂的世界确立一个简单的目标,有时只会适得其反。
英国的全民医疗服务制度(NHS)是由英国政府资助的、具有社会福利性质的公共医疗制度。这一制度自第二次世界大战结束后开始实施,迄今已有60余年历史。它的基本原则是:全民享有,免费医疗,按需服务。《泰晤士报》曾经做过一次调查,询问20世纪英国最伟大的成就是什么,近半数的受访者毫不犹豫地回答:全民医疗体系。不过,尽管许多英国人谈起全民医疗制度都为之骄傲,但它的具体操作办法可把这些民众气到内伤。最主要的麻烦浓缩起来就一个字——等。预约就得等,时间还挺长。1997年,托尼·布莱尔(Tony Blair)上台,其执政目标之一便是改进NHS,比如缩短就诊周期。医改方案规定,病人电话预约成功后,医生必须在48小时内给病人看病。在布莱尔的体系中,提供医疗服务的每一个人、每一个机构都变成了责任人。
然而,这个方案存在一个致命漏洞。2005年英国大选期间,滔滔不绝谈论医改方案的布莱尔,被直播间的一位现场观众问得下不了台。这位女观众称她给医生打了一周的电话都没有接通:“每天早上我一起来就打电话,一打就是三小时,可就是没有人接,没有人接我就不能预约。”布莱尔一脸错愕。
这位观众和她的注册医生都注意到了一个布莱尔没有察觉的漏洞:事有轻重缓急。一旦预约过多,谁来抢救那些急诊病人?为了不影响急救同时避免违反“48小时”规定,医生只能拒接电话、拒绝预约。由于病人只有在打通电话之后才能预约,没有预约也就不存在违规。未接通的电话不会被记录在案,于是,很多患者只有每天不停打电话,希望能接通。那些打通电话的病人,确确实实在48小时以内得到了治疗——布莱尔定下的目标以这种方式实现,医疗服务质量大打折扣。
听完观众的苦水之后,布莱尔想找个台阶下,便说这也许只是个例。主持人询问现场观众是否有过类似经历,结果,三分之一的人举了手。布莱尔慌了,只好尴尬地说:“事情不应该这样啊。”确实不应该啊!
1763年,林业员约翰·戈特利布·贝克曼(Johann Gottlieb Beckmann)召集了一群工人一起干活儿。这些人每人手头有一条多功能腰带,上面有5个皮袋,里面分别装有固定数量的钉子,颜色各不相同。工作的时候,工人们肩并着肩形成一排,缓缓走在林地里,好像在寻找丢失的钥匙或是受害者的尸体。
其实他们是在统计这片林地。每经过一棵树,工人便根据树的大小钉入不同颜色的钉子,一种颜色代表了一个尺寸(从1到5)。待他们走完这片茂密的树林,数一数皮袋里还剩下多少钉子,这种方法可以统计出这片林子共有多少棵树以及它们的尺寸分布。
如果你喜欢林中漫步,森林的繁杂反而是它独特的魅力。树木的生长受到土壤、坡度和阳光的影响,自然而然,一片林子里的树木各有千秋:有的饱经风霜,长满了树瘤;有的直耸云霄,尽情沐浴在阳光之下;还有的细细长长,零散分布在整片林子里。如果你是一位商人,恐怕难为美景所动,只关心这片林子的出材量。如果你是一位林业员,关心如何根据树木的情况向木材厂征税,那么森林的杂乱就不再是风景,而是你工作的障碍。要计算树木的数量,比较不同种类的商业价值,可是一件再苦不过的差事了。
政府部门总是固执地以为对这个世界了解得越透彻,就越有利于开发它、控制它。于是政府和大型企业联手,最大限度地量化这个世界:从无人机和卫星拍摄的高清照片,到社交软件(如推特、微博、微信)的定位功能,到手机跟踪,再到“物联网” [1] ……我们尝试一切可能去了解这个世界,测量这个世界,给它钉上五颜六色的钉子。这样做的后果便是,我们会按照自己的测量结果对世界进行改造。这究竟意味着什么呢?
起初,18世纪的林业员在测量森林的时候,只能使用微积分同时利用木柴堆做一些实验,从而算出一棵“标准树”的出材量,毕竟经济利益才是他们关心的。但是这样太麻烦了,于是约翰·贝克曼想出了一个改造方法,就是挪走不同年龄、不同品种的树木,取而代之的是同一年龄、同一品种的树木——比如,相当受欢迎的挪威云杉。贝克曼称这为“科学造林”。这些云杉排列整齐,不仅方便林业员测量,还方便护林和采伐。死掉的树木被砍掉,地上的朽木被清走。“标准树”原本只是一个理论概念,它的提出只是方便林业员测量,贝克曼却把它变成了实践。终于,这片林子越来越接近林业员为它绘制的地图和表格了——它们如此整齐,让林业员赏心悦目。
这一工程带来了巨大的经济效益,但对当地的农民来说却是莫大的不幸。他们再也不能去森林拾柴火,不能取树液做胶水、药材和点火液,也不能捡橡子喂猪。对他们来说,森林蕴藏着无数宝藏,只是掉进钱眼儿的林业员和商人看不上,更别说一一记录在案了。也正因为没有官方记录,农民的损失直接被政府忽略了,一分钱赔偿也拿不到。
布莱尔是英国的首相,他的医改自然有政府作后盾。贝克曼虽然只是一个林业员,但是如果背后没有政府和大地主撑腰,他的“科学造林”恐怕也难以实施。政府永远不可能了解世界的全部,却掌握了改变这个世界的权力,这种改变有时是负面的、毁灭性的。
接下来我们来学习一个专有名词——阿普加评分(Apgar Score) [2] 。其分值范围为1—10,得分越高,表明新生儿身体越正常。新生儿出生后,熟练的产科医生和护士只需要看一眼便能给出得分,从而判断新生儿是否能正常发育。新生儿全身皮肤呈粉红色得2分,大声啼哭得2分,心搏有力得2分,呼吸规律得2分,肌张力正常得2分。20世纪50年代,阿普加评分由美国的弗吉尼娅·阿普加(Virginia Apgar)提出,她其实是一位麻醉师,并不是产科医生。奇怪吗?完全不,如果新生儿阿普加评分太低,便会由医院的麻醉师主导,联合产科进行抢救,手术后阿普加评分呈现的变化直接反映了新生儿情况转归是否良好、抢救复苏是否有效。
按标准给新生儿打分,如同给森林的树木钉钉子,带来了不可预料的后果。根据外科医生兼作家阿图尔·葛文德(Atul Gawande)在《纽约客》(New Yorker )文章里的解释,阿普加评分“将错综复杂的新生儿的身体情况变成了一个个简单的、方便统计和比较的数字”。
产科医生之间竞争激烈,每个人都想提高自己负责的新生儿的阿普加评分,产科主任也开始关注这些数字。“当产科主任将注意力集中在这些数字上时,他们把自己变成了面包厂的经理,暗地里观察着每一个面包师烘焙了多少面包。”葛文德在文章里写道,“产科主任也好,面包厂经理也好,都希望提高员工的效率——无论是职场新手还是经验丰富的老手。他们会想方设法达到这一目标。对他们来说,工作不用做到完美,达标才是最要紧的。”
于是,剖宫产开始流行起来,医生直接剖开孕妇的腹部和子宫取出胎儿,而不是使用操作难度较大的手术钳进行顺产。其实如果顺产的话,产妇可以少挨这一刀。但是和顺产相比,剖宫产更简单,医生只要按照标准流程操作即可,实习医生学起来也很容易。剖宫产可以用到每一个孕妇身上,完全不用担心难产。难产时,胎儿很可能会因为脐带绕颈、供血不足而出现缺氧、窒息,这会损害脑细胞、影响智力,甚至发生死亡。也就是说,难产儿的阿普加评分有可能偏低。据统计,在美国剖宫产手术占总生产手术的三分之一,在英国是四分之一,而产科专家认为只有10%~15%的孕妇真正需要剖宫产。其实,受生产方式影响最大的是产妇,顺产对她们的伤害比剖宫产小得多,但是医生并不关心,反正产妇产前产后的身体情况又不会像新生儿那样被打分。弗吉尼娅·阿普加发明阿普加评分的时候,可没想到会发生这样的情况。
20世纪90年代初期,纽约和宾夕法尼亚开始试行“分数卡”制度,这是一项针对医院和外科医生的打分制度。和阿普加评分不一样,医院和外科医生的得分会被美国医疗系统公开,这样一来,患者就可以根据这些信息选择自己喜欢的医院和医生就诊。通过“分数卡”将某一位外科医生的得分情况告知患者、保险公司等利益相关方,美国医疗系统的背后意图是奖励医术精湛的医生,惩罚庸医,同时激励每一位医生提高自己的业务能力。分数卡制度激化了医生之间的竞争,游戏进一步升级。
赢得游戏的方法有很多,然而并不是每一个都正大光明。四位经济学家戴维·德兰诺夫(Dowid Dranove)、丹尼尔·基思勒(Daniel Kessler)、马克·麦克莱伦(Mark McClellan)和马克·萨特思韦特(Mark Satterthwaite)研究了分数卡制度对老年心脏病患者的影响。他们发现,对这一特定人群来说,分数卡有一个致命副作用:外科医生会尽可能避免给病危患者做手术,而对那些还没到手术程度的老年心脏病患者,他们又会极力推荐手术。
分数卡制度下出现这一结果并不难理解。病危患者的手术死亡率高,会毁了医生的名誉。相反,给未到手术程度的病人做手术则是一箭双雕。一方面,术后病人康复快,生活质量更高;另一方面,医生的手术成功率会上升,医生的名气会更大。
最后,德兰诺夫和他的同事得出结论:分数卡制度不仅让医生过多追求手术的经济利益,还让很多病危患者得不到及时的救治。借用布莱尔的话来概括,“事情不应该这样啊”。
布莱尔的“48小时”目标让医生不敢接电话,不敢给病人预约;贝克曼的“科学造林”破坏了森林的生物多样性,损害了当地居民的利益;阿普加的评分导致剖宫产比率上升;美国医疗系统的“分数卡”制度导致心脏科医生给不需要手术的患者做心脏搭桥手术。当人们尝试用数字去测量、去评估,甚至将一个简单的数字作为终极目标时,招致了严重的恶果。细心的读者可能已经发现这四个案例中有三个和医疗有关,这并不是巧合。医疗行业的监管一向严格,对于难以估量的复杂问题又必须给予明确的答复,例如患者会问“我还要等多久?”“我会死吗?”。
接下来,我们来看看教育领域是否也存在同样的情况。美国第三大新闻杂志《美国新闻与世界报道》每年会在其官网发布美国高校排行榜,其中一项指标是各个大学的录取率。录取率越低,在一定程度上说明了这所大学申请人数越多,录取标准越高,大学就越好。每一所大学都希望自己的排名尽量靠前,于是他们打起了录取率的主意。
2012年,媒体披露了波士顿的东北大学,称东北大学一共给美国高中的管理人员发出了20万封信,随后还有6~8封电子邮件跟进,恳请这些管理人员能够大力向学生推荐东北大学,以增加申请人数。之后东北大学便可以在计划录取人数不变的情况下拒绝更多的申请人,这样录取率便降低了,自己在排行榜上的排名也靠前了。
在美国,大学的申请也被标准化了。学生统一通过通用申请系统(Common App,或者CA)填写申请表,上传相关材料,然后系统便可以将学生的申请同时向多所大学投递。包括芝加哥大学在内的一些高校曾经联合反对这种申请方法,结果发现申请自己学校的人数下降了,录取率上升了,名次下跌了。2007年,芝加哥大学终于决定采用CA,紧接着,申请人数同比上涨了数千人,录取率终于降了下来,名次也随之前移了。
在英国,也有这样一个针对高校建立的评价体系——科学研究卓越框架(REF),它是英国高校资助机构用来评价英国高等院校科学研究项目质量的一个行动计划。这一评价体系实行没多久就出现了一个明显的漏洞:大学可以通过聘请兼职教师去分享他们的科研成果。兼职教师的工作时间仅为全职教师的20%,薪水也只有全职教师的20%,但是他们的科研成果却可以全部纳入其兼职机构,这买卖确实划算。最近,英国的伯明翰大学在哲学研究领域拿了全国第一,却被爆料其哲学系好几位教授都只是兼职,更多时候他们在哈佛大学和纽约大学做研究。
接下来我们离开教育领域来看看国际发展。2000年,联合国189个成员国签署了《联合国千年宣言》。这一行动计划本意是帮助贫困国家脱贫,却很快被一些国家当成了争夺发展援助的工具。《联合国千年宣言》共有8项目标,其中最广为人知的是在2015年之前,将世界上每一个国家的极端贫穷人口比例减半。这一目标对于像保加利亚和墨西哥这类中等收入国家而言比较容易实现,因为他们的极端贫穷人口率只有2%。而对那些极端贫穷人口率高达20%的国家来说,实现这一目标谈何容易。由于中等收入国家能够更好地完成联合国定下的目标,它们的“表现”更佳,所以不少援助国更愿意把资金投入这些国家,而那些最需要扶持的区域却被遗忘了。据联合国报告显示,近几年仅有三分之一的援助总额流入最不发达国家。
为什么上文那些看上去合情合理的目标却总是带来意想不到的后果呢?这是因为从一开始这些目标就是错误的!人们很容易制定错误的目标,这是为什呢?设立正确的目标就那么难吗?
1995年,约克大学的经济学家彼得·史密斯(Peter Smith)进行了一项研究,他想归纳出所有可能导致制定的目标引起灾难性后果的因素,以指导人们在制定目标时及时避免错误、规避风险。
史密斯搜集的一系列证据都指向一个事实:人们制定的目标过于简单,而世界过于复杂。任何可以计量的事物都无法全面反映所涉及的真实情况的复杂性。阿普加评分就是这样:新生儿的阿普加评分并不能说明全部问题,其身体真实情况要比一个简单的数字复杂许多。阿普加评分之所以受到医护人员的重视,是因为它实在太省事了。
再比如一位因为严格遵守时间表而受到公司表彰的公交车司机。他为了能在规定时间内跑完全程,很可能会为了抢时间而直接开过某一个公交车站,看都不看排队等候的乘客。这些事例都是因为管理者的视野太过狭隘,制定的目标也太过狭隘。
在一些极端情况下,狭隘的目标还会造成毁灭性的后果。戴维·德兰诺夫针对纽约和宾夕法尼亚分数卡制度的研究有力地证明了这一点。分数卡的初衷只是为了衡量某位心脏科医生是否擅长心脏搭桥手术,却没想到一些病危患者却因此丧了命。由于患者直接在分数卡的数字和医生的能力之间画等号,导致医生一味追求手术成功率。这意味着他们只愿意选择情况不那么严重的病人做手术,由于这种手术难度不高,于是医生也懒得提高自己的医术了,得过且过。还有更讽刺的。两位统计学家哈维·戈尔茨坦(Harvey Goldstein)和大卫·斯皮格豪特(David Spiegelhalter)在搜集、分析分数卡的数据后发现,决定手术是否成功的并不是医生的医术——反正都差不多——而是运气!第一年成功率最高的医生第二年很可能变成垫底的,反之亦然。那么,究竟是什么原因导致人们在制定目标时频频出错?
第一,狭隘的目标制定者总是为了追求眼前的利益而不计长远。比如,一位经理可能为了节省开支而减少员工的培训,或者干脆直接克扣员工工资。短期内,公司的盈利确实能上升,但是长期呢?长期下来,公司必然会走下坡路。
第二,目标也具有时效性,你不能指望用昨天的目标去解决明天的问题。世界的变化速度之快,不是官僚主义者能够把控的。那些制定了狭隘而僵硬的目标的机构或个人肯定会在事物的变化发展之中遭受重重打击。试想有这样一家公司,他们的目标是清楚地解答每一个致电客户的疑问,却完全没有想到发展线上客服。我们生活的时代是一个互联网时代,这家公司的目标无疑是狭隘的,制定这一目标的人想当然地以为客户只会打电话,而不是使用电子邮件等网络工具。
俗话说上有政策,下有对策,下面总能找到方法应付上面——撒谎和作假。当一个员工明明没有完成上司定下的目标又不想被责骂时,他很可能选择撒谎。然而还有更可怕的,造假。想想纽约和宾夕法尼亚的医生,为了提高手术成功率,直接拒绝给危重病人做手术;想想布莱尔的医改,医生干脆不接病人的预约电话。如果纽约和宾夕法尼亚没有推行“分数卡”制度,布莱尔没有规定“48小时”,医疗服务的质量不说会提高,起码不会下降吧。
接下来的一个案例也发生在布莱尔的医改过程中,它给上文提到的研究目标如何造成严重后果的彼得·史密斯提供了很好的研究对象。
20世纪90年代,英国的医院有这样一条规定:救护车在接到市区范围内的急救电话后,如果病人情况十分危急,那么救护车必须在8分钟之内抵达现场。布莱尔上台后,进一步强调了这项规定。
结果呢?相关医护人员为了不违反规定,只能撒谎、作假。我们来想象这样一张曲线图,曲线的绘制是基于急救电话接线员所提供的救护车用时。线条的走向基本比较平缓,然而在7分50秒这个时间点却突然开始陡峭上升直至8分钟最高点,在8分1秒以及之后的区间段的数据为零。这怎么可能!不言而喻,包括电话接线员在内的相关医护人员撒谎了。
几秒之间的差别确实不打紧,不会影响医护人员抢救病人,但是还有一些情况可就严重多了,直接危害了病人的利益。
很多医护人员错误地将“救护车必须在8分钟以内赶到现场”理解为“越快越好”。想象一辆救护车正在公路上疾驰,时间在一分一秒地流逝。6分钟过去了,7分钟过去了,很快便到了8分钟的时限。这意味着救护车没能达到“8分钟”目标,或者按专业人士的话来说“违规了”。接下来该怎么做?既然是“越快越好”,那就直接改道去还在时限以内的病人那里吧。最开始打电话的那位病人被无情地抛弃,他发现自己怎么等都不见救护车的踪影。医护人员被病人投诉时,可以辩解说当时另一位病人的情况也很紧急。
医护人员还可以在病人的病情分级上打主意,也就是怎么去定义濒危、危重、急诊、非急诊等。这种分级非常主观,同一病人的病情可能出现多种分级,这给了急救人员一个很好的借口。由于8分钟时限主要是针对濒危或危重病人,医护人员如果没有及时赶到,完全可以将病人的病情降级而敷衍过去。
救护人员能够钻的漏洞实在太多了。有时候,一辆救护车上的两名救护人员会兵分两路,特别是在交通拥堵的时候,由一位骑摩托车甚至自行车先赶去现场。救护人员确实是在8分钟以内赶到了,但是如果病人需要送到医院,总不能用摩托车或自行车载着去吧。
其实,救护人员内心也很憋屈。无数个夜晚,医院会安排他们以及救护车通宵守在急救高发区域,这样一旦有事,他们可以更快赶到现场。短期来看,急救服务确实提高了,但是长期下来,救护人员疲惫不堪,士气低落。这便是所谓的“短期主义”。
救护车的8分钟时限还受到了另一指责,只不过目前还没有确凿的证据:管理人员会抽调乡村地区的救护车到城区,因为8分钟时限仅仅针对城区。很明显,这一规定将乡村地区的急救放在了不利地位,尽管这并非布莱尔的本意。
总结来说,8分钟的时限造成了太多意料之外的后果,从数据造假,到病情分级,到自行车登场,到乡村地区急救受损,再到救护人员士气低落。政府的本意是提高急救服务的效率和质量,却没想到南辕北辙,造成了这么多负面影响,引来一片骂声。
那怎么才能制定更加合理的目标呢?有人提出可以尽量让目标复杂化、标准具体化。这样真的能奏效吗?
1988年,巴塞尔委员会通过了第一个有关如何监管银行以避免金融危机的国际协议——《关于统一国际银行的资本计算和资本标准的协议》(简称《巴塞尔协议I》)。它将所有的国际银行纳入其监管体系,规定了银行应该具有的最低资本额度。只有资本充足的银行才有能力承受巨额损失,避免破产;相反,缺乏资本、主要靠借贷经营的银行则很容易受到经济危机的冲击。 [3] 简而言之,《巴塞尔协议Ⅰ》不允许银行借款太多或者举债过重。 [4]
《巴塞尔协议Ⅰ》被视为建立一个稳定的全球金融体系的第一步,然而它却忽略了一个事实:银行投资行为所涉及的风险是完全不一样的。比如,有一家银行给硅谷一家新公司放款1亿美元,而另一家公司给美国政府贷款1亿美元,前者承担的风险肯定远远大于后者。如果只考虑银行的举债而忽略其投资所涉及的风险,显然是不合理的。
虽然《巴塞尔协议Ⅰ》确实划分了5个风险档次,对银行资本的要求会根据风险档次的变化而变化,但是监管人员很快发现这5个风险档次的相关规定过于简单,存在很多漏洞。银行在评估风险时,都是利用高端计算机技术建立风险模型,而《巴塞尔协议Ⅰ》提出的模型简单到用一张纸、一支笔就可以搞定。因此,银行想方设法钻空子,希望能举债最大化。 [5] 考虑到银行风险模型和巴塞尔模型之间的差距,想找到漏洞轻而易举。银行会去寻找一些看似安全的投资蒙混过关,但是这些银行家心里比谁都清楚表面安全的投资其实风险很大,回报率也很高。
鉴于这些教训,2004年,巴塞尔委员会修改了协议,对风险的划分和规定更加详细了。修订后的版本被称为《巴塞尔协议Ⅱ》,长达347页,而之前的版本只有30页。新协议的风险模型是在银行的模型基础之上建立的,其风险参数多达上百万种,不仅有数据支撑,还经过了市场的检验。
旧协议的漏洞虽被填补了,但是现在回过头去看,《巴塞尔协议Ⅱ》依然是一个失败:这一号称全球最复杂的金融稳定协议签署4年后,便爆发了史上最复杂的金融危机。这究竟是为什么?
《巴塞尔协议Ⅱ》的修订紧紧围绕风险评估,如果投资的风险越低,银行的举债就可以越高。最小风险系数为“0”。如果银行可以找到一个投资项目,不仅风险为0,收益还很可观,那么《巴塞尔协议Ⅱ》便鼓励银行贷款投资。但是,去哪里找既没有风险、回报又高的项目呢?答案是希腊政府债券。《巴塞尔协议Ⅱ》的制定者都是经济实力雄厚的政府,规则的制定自然也会偏向这些政府。欧盟的银行借钱给欧盟国家的政府时,风险评估都为0。
因此,欧盟的银行便放开胆子举债,然后用借到的钱大批买入希腊政府发行的债券。按照《巴塞尔协议Ⅱ》的规定评估,希腊政府债券的风险系数为0,而且回报很高。然而市场规律告诉我们,风险越低,收益越低,风险越高,收益越高。这也就意味着,希腊政府债券的实际风险并不低。《巴塞尔协议Ⅱ》的死穴之一就在于它会鼓励银行往表面风险为0而实际风险很高的金融产品上大把大把砸钱。
银行对这类金融产品的需求巨大,于是新的金融产品纷纷上市,这其中就包括风险极高的次级抵押贷款。这类投资具有黑天鹅效应——或许是巧合,或许是人为,风险全被挤压到最次一级的贷款上面。也就是说,这些投资通常都是安全的,投资回报记录看似也很稳定,但一旦危机爆发,后果就是灾难性的。
《巴塞尔协议Ⅱ》的死穴之二就在于它会让所有银行出于同一原因而陷入同一危机。各大银行之间不再是一种自然竞争的状态,它们失去了在全局范围内寻找投资项目的兴趣,而是争先恐后地往《巴塞尔协议Ⅱ》的漏洞钻——借钱给希腊政府,购买次贷衍生品,最终不可避免地都被困在同一个泥潭。
金融危机之后,《巴塞尔协议Ⅲ》出台,它比《巴塞尔协议Ⅱ》更保守,也更复杂,内容也增加了一倍,而一些国家出台的金融监管改革法案则更长(比如美国的《多德–弗兰克法案》),长达上万页。那么,《巴塞尔协议Ⅲ》是否能够解决《巴塞尔协议Ⅱ》产生的问题呢?《巴塞尔协议Ⅱ》已经明确表明了规则再复杂,银行也能找到漏洞钻,充其量银行和巴塞尔委员会之间的过招更复杂、更难以预测而已。
金融危机爆发后的几年,英格兰银行首席经济学家安迪·霍尔丹(Andy Haldane)提出了一个大胆假设:假如巴塞尔委员会在量化风险方面做出的努力其实都是徒劳无效的呢?霍尔丹可以算是各大央行里最敢想的人物之一了。
霍尔丹仔细分析了在此次金融危机中破产银行的风险数据。在金融风暴来临之前,根据《巴塞尔协议Ⅱ》和《巴塞尔协议Ⅲ》的标准,这些银行都是很安全的。霍尔丹对比研究了《巴塞尔协议Ⅰ》和史上最简单的风险评估标准——银行负债,想看看哪一个在控制银行风险方面更有效。
在美国怀俄明州杰克逊小镇举行的全球央行行长年会上,霍尔丹向与会者公布了他的结论:无论从哪一个角度分析这些数据,我都发现这些看上去极为细致、严密的风险管理方法还不如一个简单的标准有效——警惕那些负债过高的银行。这一衡量标准在很多情况下出人意料得可靠。心理学家格尔德·吉戈伦泽尔(Gerd Gigerenzer)搜集了很多领域的案例,这些案例都反复证明一条简单的标准要比一套复杂的、理论上最佳的标准有效。接下来我们看看其中三个案例:雪崩、心脏病发作以及投资组合。
雪崩这一自然灾害是很难预测的,它源于降雪、气温、坡形和其他因素间微弱而又复杂的相互作用。那些造成极其重大损失的雪崩发生频率并不高,所以很难预测。这可苦了那些滑雪爱好者,因为他们随时都面临着生命危险。然而,这并不意味着他们就没有办法保护自己,他们可以使用一个简单、有效的工具——“雪崩迹象”检查清单,滑雪的人都知道。这份清单的内容包括:过去48小时内这一区域是否发生过雪崩,表层积雪是否有融化迹象,过去48小时是否下过雪或阵雨,等等。如果有几项的答案是肯定的,则说明滑雪者应该远离所涉及区域。研究人员分析了美国的一个数据库,其中包括751次雪崩的数据,他们发现绝大多数雪崩都符合检查清单上好几项描述,换句话说,这份清单拯救了很多滑雪爱好者的生命。
霍尔丹提出在管理银行面临的风险时,最有效、最直接的方法就是看这家银行资本多少、举债多少。其实这一点就好比滑雪者预测雪崩时手上那份检查清单。
如果一份简单的清单就能预测雪崩,那是否也存在一份清单能预测心脏病呢?如果急诊室的医生收到一位有严重胸痛的病人,医生要如何迅速判断病人是否处于心脏病发病初期呢?如果是,那么医生需要迅速将他转移到冠心病加强监护治疗病房(CCU)。但是CCU的费用很高,而且病人还可能感染上耐药菌株(医院是这种病原菌的温床)。如果医生判断错误,病人并没有心脏病突发的危险,他只需要吃点儿消食片然后休息一下,那这位病人岂不是成了冤大头?其实要迅速诊断病情,医生可以采用很多方法。
由李·格林(Lee Green)带领的密歇根大学研究小组观察了在以上情况下医生是如何做出决定的。他们发现医生总是过于谨慎,也就是说,无论病人的胸痛是不是心脏病突发初期的征兆,绝大多数情况下,医生为了保险起见都会将胸痛病人转移到CCU。他们还不如直接扔骰子算了!
为了减少医生的误诊,研究人员设计了一套复杂的诊断指南,里面有一张概率表和一个便携式计算器。这份指南要求医生对胸痛病人做一些测试,然后查看概率表,将测试结果对应的数字输入计算器,便可以计算出一个病人心脏病突发的概率。这份指南成功地使医生大大减少了误诊次数,但是被医生错误忽略的、处于心脏病发病初期的患者数量也上升了一些,这便是这份指南的副作用,不过是药就有副作用。这份指南真正的问题在于它使用起来太麻烦了。
于是,李·格林和他的同事又设计了一棵决策树,将重点放在几个最明显的心脏病发病征兆之上,概率表中的很多细节都被省略了。决策树只有三个问题:问题一,病人的心脏监护器是否显示有异常?如果有,立刻送CCU,如果没有,请看问题二;问题二,病人只是主诉胸痛吗?如果不是,不用送CCU,如果是,请看问题三;问题三,病人有以下五个症状之一吗?如果有,立刻送CCU。决策树的问题简单明了,一张明信片大小的卡片就可以放下,不像此前的概率表,复杂到还要使用计算器。事实证明,这棵决策树很有效。它比经验丰富的医生和此前的指南都厉害,基本上有心脏病突发危险的病人都被及时送到了CCU。更重要的是,它节省了急诊的时间以及急诊医生的精力。正因为它如此方便有效,很多医生都用它(而不是此前那份指南)来判断胸痛病人的病情。
接下来我们再来看看最后一个完全不同的问题——如何用我们的养老钱选择最佳投资组合。1952年,一位年轻的金融领域的教授哈里·马科维茨(Harry Markowitz)发表了学术论文《资产组合选择——投资的有效分散化》,提出了一个如何选择最佳投资组合的复杂方法,其目的是在收益一定时将风险最小化,或者在风险一定时将收益最大化。背后的理念非常简单:如果你同时购买雨伞公司和太阳镜公司的股票,那么不管气候怎样变化你都会安然无恙。理念虽然简单,但是运算方法却很高深——高深到让马科维茨获得了诺贝尔经济学奖。
然后,在马科维茨身上发生了一个有趣的故事。他的论文发表之后不久,马科维茨换了一份工作,同时开始计划养老。这可是检验他投资理论的好机会,他可以利用自己的理论为退休生活选择一个最佳投资组合。然后,马科维茨直接用一半的钱买了股票,另一半的钱买了债券。通过这一故事,人们发现很多经济理论都过于烧脑,烧脑到没人可以运用到实践中,理论的提出者也不例外。
作为一个小小投资者,马科维茨并没有错;而作为获得诺贝尔奖的理论家,他却大错特错。原因很简单,他的理论是构建在无数数据之上的,而在实际投资中,上哪里去找这么多数据。
比如,我们现在要考虑两家石油公司的股票。马科维茨的理论预设了我们已经知道这两只股票的相对走势,然后会建议我们同时购买两只股票。但是,这两只股票的相对走势究竟如何?回顾它们的历史,我们看到有时候两只股票的价格波动趋于一致:油价上涨,股价便上涨;油价下跌,股价便下跌。但是还有一些时候——诸如2010年发生的“深水地平线”漏油事故——涉事公司的股价会暴跌,从而便宜了竞争对手。这些历史给我们提供的数据确实有一定指导意义,但是这种指导意义是十分有限的,因为我们完全无法根据如此有限的数据预测诸如漏油之类的事故何时会再次上演。
最新的研究表明当数据有限时,马科维茨的经验法则——把资金分成等额数份,分别投资股票、债券和房产等等——要比他的诺贝尔获奖理论有用得多。
《巴塞尔协议Ⅱ》和马科维茨的获奖理论存在一个相似之处,它们都需要大量的数据支撑才能行之有效。然而,难就难在这里。21世纪初期,银行使用的风险评估模型——《巴塞尔协议Ⅱ》也鼓励它们使用——是建立在过去短短几年的数据之上,然而涉及的参数却多达上万种,也就是说这一风险模型将极其复杂的统计结构建立在了极其单薄的基础之上。说得简单一点,就好比在不稳的地基上盖高楼。
这一问题就叫“过拟合”。想象眼前有一幅散点图(即数据点在直角坐标系平面上的分布图),上面有一条拟合曲线,它表明了数据的大致走势(拟合曲线并不会穿过每一个数据点,它只是模拟数据的走势)。而过拟合曲线更像是一个点到点的谜题,想找到一个根本不存在的规律,例如心脏病突发和雪崩。一旦有了新的数据,其在直角坐标系上对应的数据点很可能都不会靠近这条过拟合曲线。过于复杂的规则就好像过拟合曲线:后见之明有余,先见之明不足。相反,一个简单的原则就好像一条拟合曲线,虽然它不会穿过所有历史数据点,却能更好地预测新数据点的位置。
让游戏的规则复杂化并不是防止玩家钻空子的方法。不管规则如何复杂,都有漏洞存在,而一条简单的经验法则往往更可靠。
雪崩和心脏病突发确实很危险,但是它们至少不会撒谎,也就是说它们不可能像人那样和规则玩捉迷藏。如果巴塞尔委员会接受了霍尔丹的说法,把其制定的数百页协议撕个粉碎,取而代之的是一个再简单不过的风险评估方法——银行的负债率(银行负债总额和其资本总额的比例),那么会发生什么呢?结果将会和布莱尔的“48小时”规定一样,银行迟早会找到漏洞。
“通过银行的负债率来评估银行的风险”这一标准只有在银行没有将某一具体比例作为目标时才能客观反映银行面临的风险;“有多少病人在预约之后的48小时之内得到了就诊”这一规定只有在医院和医生没有将48小时作为目标的前提下才可以客观反映医院的服务质量;同理,“有多少救护车在接到急救电话之后的8分钟内赶到了现场”只有在救护人员没有将此作为目标的前提下才能体现急救服务水平。也就是说,一旦我们试图把评估标准变成目标,事情的性质就变了。
幸运的是,有一个老办法可以解决这个问题,每一个学生都很熟悉它——考试。
想一下考试是如何运作的。一个学生经过数月或数年的学习,累积的知识只有一小部分能在考场派上用场。1830年,哲学家杰里米·边沁(Jeremy Bentham)在设计公务员考试的时候,只设定了一个模糊的考试范围,不给具体的考题,这样有效避免了考生钻空子。如果要想脱颖而出,考生只能努力学习,争取样样精通。
所以,解决问题的方法既不是厚重的各个版本的《巴塞尔协议》,也不是单独一条简单的标准。相反,我们应该尽可能定下数条标准,但是对什么情况下使用什么标准却不能做任何规定。就比如救护车,你可以保留“8分钟赶到现场的救护车占比多少”作为衡量急救服务的标准,但是,你还需要增加更多的标准:12分钟、20分钟或者6分37秒赶到现场的救护车占比多少;有多少病人因为没有被定义为“濒危”而失去了性命;乡村地区和城市地区的急救服务是否一致;等等。你可以定下数百条类似的简单标准,医院如果要造假的话,满足了一条也满足不了下一条。平时效率就很高的急救服务一般也不怕这些标准的考核。
但是这样做也有一个风险:如果急救服务摸清了每一个标准所占的比重以及最后的总分是如何打出的,他们也可能做手脚。所以,每一次评估时,监管机构千万不要一条一条全部查看,这样太过官僚主义,也太荒谬了。相反,监管人员可以随机挑选其中几条,然后再进行深入评估。
那如何有效监控银行风险呢?方法是“银行压力测试”,这是一种以定量分析为主的风险分析方法。首先假设一种情况,例如利率暴涨、货币贬值或者房地产市场崩溃,然后运用这一方法测试银行的抗风险能力。然而,这些测试太容易预测了,就好像提前通知了考生考题的测试。
这里可以借鉴边沁的方法,也就是让测试变得难以预测,这一方法被无数考官偏爱。英格兰银行的首席经济学家霍尔丹也觉得这是完全可行的。
“你去金融企业的时候,别提前打招呼,必须搞突袭。你可以对企业说‘我可以看一下你们针对……的压力测试吗?”霍尔丹停顿了一下,想找一个例子,“针对你们的杠杆贷款组合?”
银行监管机构绝对不能给银行几个月的时间准备答案,监管人员应该坚持在数小时内就得到答复。如果银行及时给了一个满意的答案,“很好,六个月之后也就是下一次抽查再见。不过,也有可能是明天或者一年以后。”
霍尔丹说:“如果银行的答复不能让你满意,那就是一个污点。如果三次突袭检查都是如此的话,就让负责人卷铺盖走人。作为银行的主管,如果第一次抽查被问到杠杆贷款的风险测试结果,你说不上来,你还有机会。如果第二次抽查被问到新兴市场投资组合风险时,你依然无法提供满意的回答,接着第三次抽查被问到主权债务风险时,你仍旧一问三不知——你确定你能够胜任主管一职吗?”
这种突击检查还有不少支持者。布莱尔政府主管医疗的高级官员格温·比万(Gwyn Bevan)、英国医学统计医学家大卫·斯皮格豪特(David Spiegelhalter)、英国统计局局长安德鲁·迪尔诺特(AndrewDilnot)也都曾建议NHS建立一个更难以预测的评估标准。
英国的银行监管机构已经开始尝试要求银行提交信息,但是不会告诉银行这些信息会如何被评估。这很好。但是总的来说,大部分监管机构都不太能接受这一方法。既然将考核的时间随意化、考核的标准模糊化,要比一套整齐的、能够预测的标准管用,那为什么这些银行监管机构如此固执呢?
一种解释是这种方法会让监管机构滥用权力。然而,这一说法未必站得住脚。就像考试,考官会被多方监管以防止其滥用权力:所涉及课程的大纲会规定考试的大致范围;过去的考试会确定一个考核的框架模式;外部考官会确保课程内容与考试评估标准保持一致;如果学生质疑自己的分数,还可以提起申诉。其实医疗、金融和其他很多领域的监管机构也可以采用类似的方法,建立一个多方监管体系。
还有一种阴谋论,监管机构会因为自己的利益而故意设置一个漏洞百出的评估体系。负责评估学校教学质量或医院服务质量的监管部门同时也承担着提高教学质量和服务水平的职责;负责评估银行风险的金融监管机构同时也需要保证银行系统的安全。当布莱尔引入“48小时”规定时,他肯定也希望制造一些可以打动选民的数据。自然,这些规则的制定者希望制定的规则能够带来一些好看的数据,能够为其创造政绩,这样做省事,风险也低。要避免这一阴谋,必须正确区分标准和目标:标准是用来评估的,目标是用来实现的。
也许最简单的原因便是我们对模糊混乱的恐惧。人类生来喜欢整齐,我们需要对监管机构的监管程序了解得一清二楚,什么时候、用什么方法都要做到心中有数。
“突击检查确实是个比较麻烦的办法,”霍尔丹自己也承认,“但是,小打小闹的行政管理揽不住这瓷器活儿。你需要的不是一支庞大的军队,事无巨细,而是一支特警队,各个突击。”
一支流动性强、行动难以预测的特警队正是许多监管机构迫切需要的。
2015年9月,世界四大汽车生产商之一大众汽车被发现尾气排放作弊。整个世界都为之震惊。大众汽车的股票暴跌,大众集团首席执行官马丁·文德恩(Martin Winterkorn)宣布辞职。所有德国人都在担心这一丑闻可能会连累其他德国汽车品牌。
汽车在出厂之前,都需要经过严格的检测,确保其发动机排放的氮氧化物不会超标,它可是很多环境污染问题的元凶——导致酸雨、排放有害烟雾、破坏庄稼、造成老年人和小孩呼吸苦难,有时还会致命。汽车尾气检测十分严格,标准也很高,大众究竟是怎么造假的?其实,标准虽然严格,却很好预测,汽车生产商对检测标准一清二楚。
大众在汽车内安装了失效保护器,蒙混过关了。这种保护器是一种复杂的算法软件,可以识别汽车是否处于被检测状态,继而切换到检测模式,此时排放的氮氧化物气体会减少,但是汽车也会出现动力不足的情况。而在正常行驶的时候,汽车的动力会更强,同时也会排放更多氮氧化物气体,也许是检测时所排放量的20~30倍。
大众的做法不是和那些钻空子的银行一样吗?银行为了通过联邦储备系统的压力测试,故意进行一些风险低、收益低的投资。正如大众在进行尾气检测时切换到检测模式,银行也有自己的检测模式。区别在于,前者违法了,而后者没有。
比大众尾气造假更可怕的是,尾气检测机构竟然放任检测标准如此透明,每家汽车生产商都对它一清二楚。1998年,美国国家环境保护局(EPA)发现了卡车生产商尾气造假的证据,于是很快对其中7个生产商采取了法律措施,其中包括沃尔沃、雷诺、卡特彼勒和马克——基本上美国每一辆柴油车的引擎都出自这4家卡车制造商。之后,尾气检测程序和标准依然没有发生任何改变。治标不治本。不过,欧洲人在嘲笑美国的时候,却没有意识到欧洲的尾气检测漏洞更多。
讽刺的是,发现大众尾气造假的并不是美国国家环境保护局,而是一个非营利组织——国际清洁运输委员会(ICCT)。ICCT并非故意针对大众挑刺,他们原本只是想找到一辆清洁车。于是工作人员做了一件非常简单但又出乎大众公司意料的事——他们给一些大众汽车安装了尾气排放监测装置,然后从圣地亚哥驾车到西雅图,这才揭露了大众的弄虚作假。
如果每位考生都夹带小抄进考场,那考试还有什么难度可言?一个随机的问题恐怕更能检测考生的真实水平。
[1] 物联网(Internet of things)指物物相连的互联网。它是新一代信息技术的重要组成部分,也是信息化时代的重要发展阶段,包括两层意思:第一,物联网的核心和基础仍然是互联网,是在互联网基础上的延伸和扩展的网络;第二,其用户端延伸和扩展到了物品与物品之间进行信息交换和通信。
[2] 这是一个首字母缩略词,第一个A代表肌张力(Activity),P代表心率(Pulse),G代表对刺激的反应(Grimace),第二个A代表肤色(Appearance),R代表呼吸(Respiration)。
[3] 银行资本是指商业银行自身拥有的或能永久支配、使用的资金,它来自银行的盈利或者银行股东。它有别于客户在银行的存款,因为客户可以随时支取;它也有别于银行从其他机构获得的贷款,因为银行必须在到期前偿还贷款的本金和利息。如果一家银行严重依靠向其他机构贷款来维持经营,那么这家银行随时随地都面临破产的风险。相反,如果一家银行主要依靠自己固有的资本运营,那么它更有可能渡过艰难时期。现在我们假设有两家银行,分别叫“冒险银行”和“安全银行”。两家银行都借出去了1亿美元,但是都出现了点儿意外,最后两家银行都只收回来9800万美元。亏损的200万美元导致了“冒险银行”的倒闭,而“安全银行”则没有。为什么?两家银行的区别在于,“冒险银行”放出去的1亿美元中,有9900万是它借来的,只有100万美元是它自己的资本。而“安全银行”的1亿美元中,9000万是借的,还有1000万是自己的。“安全银行”和“冒险银行”的差别可以简单概括为:“冒险银行”的负债总额是其资产总额的99倍,而“安全银行”的负债总额是其资产总额的9倍而已。“冒险银行”之所以倒闭是因为它无法偿还9900万美元的贷款,而“安全银行”可以动用自己的固有资本还贷。尽管“安全银行”的股东会大发雷霆,但是至少他们的银行还可以继续运营。留得青山在,不怕没柴烧嘛。
[4] 有人可能觉得一家银行能有多少资本,为什么非要人为进行监管,交给市场不就好了,谁也不会蠢到借钱给一家负债累累的公司。全部交给市场调控的结果会怎样,我们无从得知,因为监管体系认为全部交给市场太草率了,毕竟银行在整个经济体系中的作用举足轻重。
[5] 有举债就有风险,那么为什么每家银行都执着于将其固有资本最小化、举债最大化?就不怕还不起吗?这是因为投资的风险越高,收益就越大,银行就赚得越多。再加上一些资深的银行家自信过头,过于相信自己的投资眼光,因此没能准确判断风险。