Local EPUB Text
附录 将流行病学模型应用于经济叙事
附录
将流行病学模型应用于经济叙事
流行病学是医学的一个子领域,它在20世纪取得了最有成效的发展。流行病数学理论是流行病学的最大贡献,它能够有力地揭示观点的流行对经济事件的影响。我们可以用这一理论模拟经济叙事的传播。
疾病传播理论
流行病数学理论最初由苏格兰生物化学家威廉·奥格尔维·克马克(William Ogilvy Kermack)和苏格兰医师安德森·格雷·麦肯德里克(Anderson Gray McKendrick)在1927年提出。该理论建立了一个现实的框架来研究传染病动态,可谓是医学思维领域的一场革命。
他们提出的最简易模型将人群分为三个类别:易感者、感染者和康复者。因此,它被称为SIR模型或分区模型。S 是易感人群,即并未感染疾病但易受感染人群所占的比例。I 是感染这种疾病并具有传染性的人群,即正在传播这种疾病的人群所占的比例。R 是已经康复的人群,即已经感染并康复、获得免疫力并且无法再次感染或传播该疾病的人群所占的比例。这个原始模型没有设定有人死亡的情况。百分比之和为100%,100%=S +I +R ,人口总数被设定为一个不变的常数。
根据克马克—麦肯德里克的流行病数学理论,在总数恒定的混杂人口中,流行病感染者的增长率等于恒定传染参数c 乘以易感人群在总人口中所占比例S 和感染人群所占比例I 的乘积,再减去恒定康复率r 和感染人群所占比例I 的乘积。每次有易感者遇到感染者的时候,都有可能被传染。如果人口庞大,传染率最终会达到一个确定的平均值。单位时间内此类碰面的次数取决于易感—感染对的数量,也就是SI 的乘积。 [1]
克马克—麦肯德里克SIR 模型的三个方程式是:
该模型没有代数解,只有近似值。 [2]
化学中也有类似的方程式,它们被称为速率方程或连续化学反应。 [3]
在本书使用的模型中,传染率是cS ,即恒定传染参数c 和随时间变化的易感人群比例S 的乘积。康复率是常数r 。如果我们将第二个方程式的两边都除以感染人群所占比例I ,就会看到第二个方程式其实就是在说,感染人群的增长率等于传染率cS 减去康复(或遗忘)率r 。这样的结论是说得通的:要想继续扩散,流行病的传播速度必须快于人们的康复速度,而且从常识来看,传染率理应取决于易感人群所占的比例。
第一个和第三个方程很简单。第一个方程式表明,每有一起新的感染病例,易感者的数量就会减少一人,因为有一名易感者变成了感染者。第三个方程式表明,每有一起新的康复,康复者的数量就会增加一人,因为每有一个人从疾病中康复(在我们的研究中即遗忘一则叙事),就有一名感染者变成了康复者。我们将在下文看到,这个基本模型对流行病传播途径有着深刻的洞见,我们可以对其进行修改,将人口增长和其他很多仅限于某一特定流行病的因素涵盖进来。
图A.1是根据上述三个方程式绘制的一个示例:最初的时候,每100万人口中有一人暴露,即I 0 =0.0001%,参数c =0.5,r =0.05。在这种情况下,几乎100%的人口最终都会被感染。在疾病流行时,公众往往把注意力放在感染者身上,即图中的钟形曲线。人们关注的还有新增病例数,即从易感人群转为感染人群的速度,如果r 不是远远低于c 的话,它也会遵循类似的钟形曲线。在叙事研究中,我们将把单词和出版物的计数图与图中的感染曲线进行比较。
SIR模型表明,从少量初始感染者开始,感染者的数目基本遵循同样的流行病驼峰模式,先是上升,然后下降。之前某种已经大幅好转的疾病如果发生变异,有可能会产生一个感染新菌株的个体。这种新疾病会滞后一段时间,然后才感染足够多的人并引起公众的关注,如果c 值很小,可能会是长时间的滞后。然后该流行病将达到传染高峰。在所有人都被感染之前,该流行病将在感染或康复参数c 和r 没有出现任何变化的情况下自行回落并结束。
图A.1 理论上的流行路线图
注:当I 0 =0.0001%、c =0.5,r =0.05时,克马克—麦肯德里克SIR模型的数值解。粗线表示感染了疾病并且正在传播疾病的人群占比。该模型假设的是没有医疗干预的情况;即使人口中还有易感人群,流行病也会自行结束,而且并不是每个人都会被感染。
资料来源:作者的计算结果。
并不是所有人都会感染上这种疾病。有些人因为没有与感染者有效接触而逃过一劫。环境慢慢变得越来越安全,因为在感染者康复并产生免疫力的时候,感染者数量就会减少,这样就没有足够的新接触来产生足够的新感染者以保持疾病的蔓延趋势。最终,感染者基本都消失了,整个人口几乎都由易感人群和康复人群组成。将这种模型应用于叙事:并非所有人都会被感染,有些人在经济叙事流行之后会说他们根本没有听说过这则叙事,即使该叙事对经济活动具有重要意义,他们还是会怀疑它对经济的影响力。
是哪些因素共同导致一种重大疾病最终传播至很多人(人口中感染和康复的总比例)呢?疾病的覆盖范围是由c /r 的比率决定的。在时间区间无限拉长的时候,曾经患病的人群所占的比例达到了绝对小于1的极限值R ∞ (即流行病的规模)。根据第一个和第三个方程式,我们可以得出 。根据初始感染人群所占比例I 0 的初始条件,即 ,而且由于I ∞ =0,1=S ∞ +R ∞ ,我们就得出了
这个等式给出了疾病最终感染人数与c/r 之间的关系。如果我们可以选择c 和r ,就可将流行病规模R ∞ 确定在I 0 和100%之间的任何位置。如果我们将“病毒式传播”定义为R ∞ >1/2,那么当 >1.386时,我们会看到从I 0 接近零开始出现病毒式传播。如果我们将c 和r 两个参数乘以任意正常数a ,那么S (at )、I (at )、R (at )也可以满足上述三个方程式。
无论c 或r 处于什么水平,c /r 越高,流行病规模R ∞ 就会越大,如果保持c /r 恒定不变,那么c 越高,流行病传播的速度就越快。对于起始规模极小的流行病来说,当S 接近1时,c /r 必须大于1。流行病的发展速度可快可慢,具体取决于c 和r 这两个参数。如果缩放图片比例尺的话,这两者的曲线图看上去基本一样。如果我们改变c /r ,那就既有可能会得出流行几天并传播至95%人口的流行病,也有可能得出流行数十年并传播至95%人口的流行病,还有流行几天并仅传播至5%人口的流行病,或者持续数十年并仅传播至5%人口的流行病。但不管是哪种情况,我们都会得出驼峰形感染模式,缩放后的图形都与图A.1中的黑粗线类似。
SIR模型的变化
克马克—麦肯德里克SIR模型是流行病数学模型的起点,大半个世纪以来它已经生成了大量的文献。基本分区模型出现了不同的版本,其中有一个版本设定了免疫力的逐渐丧失,这样的话康复者又会逐渐转变为易感人群(SIRS模型)。 [4]
还可以对SIR模型做出调整,设定易感者和感染者之间的接触会导致暴露者E 的增加,暴露者属于第四个类别,他们日后会变成感染者(SEIR模型)。人们还对SIR模型添加了愈后产生的部分免疫力、新易感者的出生、具有极高传染性的超级传播者以及传播的地理模式等。
这些针对相应疾病的修改模型在预测流行病进程方面发挥了作用。比如,SEIR模型经过修改之后,假定暴露但并无症状的人能够长途旅行,从而解释了流感的地理蔓延。格莱斯(R.F.Grais)及合著者将该模型应用于流感数据和城际航空运输量数据之后发现,他们的模型有助于解释流感暴发的城际模式和城际时间模式。 [5]
分区模型的另一个例子是SEIHFR的随机扩展模型,其中S 为易感者,E 为暴露者,I 为感染者,H 为住院者,F 为死亡但未掩埋者,R 为康复者或已被掩埋者。该模型与非洲埃博拉疫情的数据相匹配, [6]
并且考虑了住院治疗和合理处置尸体等阻止疾病传染的公共举措。
SEIHFR分区模型有六个分区,不过,以后的经济叙事模型可以设置更多的分区并从中受益。比如,技术性失业叙事(请参阅第13章)的传播模型可以设置失业且受感染、失业未受感染、受雇且受感染、受雇未受感染的分区以及传统经济模型中的附加方程式。
经济模型也可以从并发流行病的医学文献中获得启发,将传染性经济叙事纳入经济模型。在医学上,当一种疾病的发展与另一种疾病的发展相互作用时,就会出现并发流行病。例如,艾滋病和结核病已被确定为具有双重传染性:同时感染这两种流行病的人数要远远多于这两者的独立模型分别预测的人数。伊丽莎·隆等人(Elisa F.Long et al,2008)根据克马克—麦肯德里克的思路提出了基本分区模型的一个变体,在这个模型中,感染了其中一种疾病的人更容易感染和传播另一种疾病。 [7]
这样的模型可以代表一个叙事星座,星座中的多个叙事通过传播相互加强。此类模型也可以代表经济叙事(如技术性失业叙事)与经济状况(如失业)的相互作用。
结构式宏观经济模型通常包含简单的单变量整合移动平均自回归模型(ARIMA),以此表示那些没有经济学理论对之予以表述的误差项或驱动变量。乔治·博克斯(George E.P.Box)和格威利姆·詹金斯(Gwilym Jenkins)在他们1970年的书中首次普及介绍了ARIMA模型。虽然博克斯和詹金斯声称这类模型在哪个科学领域都有用武之地,不过最积极的使用者还要属经济学家。 [8]
由于可以用ARIMA术语描述的时间序列预测理论非常成熟,ARIMA模型在经济学家中的流行导致理性预期模型的流行略有延迟,(根据Google Ngrams统计)后者在1990年左右达到最高点,不过至今仍在流行。ARIMA模型是本附录中所述分区模型的替代方案。但是,ARIMA模型本质上具有一定的武断性,与分区流行病模型不同,它缺乏理论基础。 [9]
我们可以通过流行病理论模型对ARIMA方法加以改进,将模拟、分类、统计和最优化方法结合起来,在传染率和康复率随时间变化的时候对流行病发展曲线进行预测。 [10]
我们可以根据对流行病结构的了解,有选择地引入流行病本身数据之外的数据,这远远胜过茫无目的地寻求“先行指标”的做法。
并不是所有的流行病数据都与分区模型框架完全匹配。我们可以看一下在美国长期而缓慢地流行的脊髓灰质炎肠道病毒案例,它从19世纪后期开始传播,在1952年达到高峰,中间还叠加了看似随机的夏季流行。清洁和卫生条件的改善本应减少而不是增加该病的发生率。矛盾的是,较低的发病率——这在很多时候本应是好事——带来的结果是涉及瘫痪或其他后果的上报病例更为普遍,因为哺乳期婴儿不太可能从母亲那里获得抗体,而抗体原本可以帮助他们获得免疫力,以抵抗这种疾病在以后的再感染中造成的严重后果。 [11]
当我们将分区模型应用于社会流行风潮和观点流行风潮时,自然需要做一些调整。一种思路是,随着某个观点逐渐变得不再那么吸人眼球,传播率应该会逐渐下降。达里尔·戴利和戴维·肯德尔(Daryl J.Daley and David G.Kendall,1964,1965)提出了一种对该想法建模的方法,他们表示可以对克马克—麦肯德里克模型进行调整,使其反映如下模式:当感染者遇到另一名感染者或康复者之后,往往会变得失去传播力,因为他们会以为很多人现在都已经知道这个故事。由于故事不再新颖有趣,新感染者选择不再进一步传播。
巴塞洛缪(D.J.Bartholomew,1982)认为,当我们将克马克—麦肯德里克模型的修改版本应用于观点传播时,不应该把停止感染他人和遗忘观点当作一回事。人类的行为可能会受到一个虽然不怎么被提起但仍被人记在心里的旧观点的影响,也可称之为“行为痕迹”(Berger,2013)。
现在,网络模型方面的经济学文献数目可观,如最近的《牛津网络经济学手册》(Bramoullé et al,2016)。但行为流行模型却为数不多。“叙事”一词在上述手册中一次都没有出现。一些修改后的SIR模型涉及了复杂的结果模式,有时还涉及周期。传播的地理模型因全球社交媒体链接而变得越来越复杂。 [12]
一些SIR模型放弃了随机混合的想法,选择了网络结构。 [13]
个体在是否允许自己被感染方面可能会做出策略性决策,而感染人群所占比例会影响这个决策(Jackson and Yariv,2005)。另外一些模型设定,个体采取某些做法并不仅仅是因为随机感染,还因为他们理性地计算过自己与他人碰面时传递的信息。 [14]
虽然人们担心现代媒体(尤其是互联网)会导致原始SIR模型在描述社会流行时不再那么准确,但不管人们之间采取何种联系方式,克马克—麦肯德里克核心模型都能够适用。出于这个原因,我们在使用SIR模型解释观点或叙事的传播时,可能需要对其做出改动,将广电传播以及人际接触传播纳入考量。 [15]
不论人们处在什么地理位置,社交媒体都会自动将叙事推送给可能对其感兴趣的人,因此叙事有着更高的传播率,而现有模型可以适应这样的变化。
社会学家伊莱休·卡茨和保罗·拉扎斯菲尔德(Elihu Katz and Paul F.Lazarsfeld,1955)以充足的证据证明了“两步传播假设”,即文化变革虽然始于新闻媒体,但需要通过主要群体的口口相传这一“中继功能”才能实现,领导这些群体的是关注新闻且数量相对较少的群体成员。 [16]
营销行业立即采取应对措施,推广了口碑传播策略和电视广告,让演员将自己演绎成能够让普通人产生认同的人物并模拟直接的人际对话。此外,营销文献发现,直接的口碑传播在说服力方面仍胜过其他形式的交流。 [17]
在研究互联网和社交媒体是否会影响SIR模型时,赵来军及其合著作(2013)提出了一种改进的SIR模型,在这个模型中,新闻媒体数量的增多类似于参数c 和r 的变动。
克里斯汀·鲍克哈格(Christian Bauckhage)给出的证据表明,克马克—麦肯德里克分区模型的SIRS变体在Google Insights(现在的谷歌趋势)的互联网模因上与时间序列数据相当匹配。 [18]
他研究了近来那些愚蠢的互联网病毒,如“O RLY?”模因,这个模因其实就是一张照片,上面是一只貌似一脸惊讶的可爱猫头鹰。模因大多荒谬而没有意义,因此我们可以预想它们会遵循一个独立于其他观点的发展过程,从而与SIRS模型完美匹配,这也正是鲍克哈格发现的结果。他一次又一次地在互联网模因中发现了大致相同的驼峰形感染模式。
认为经济叙事的传播模式类似于疾病流行的更多理由
即使现代传播媒体已经使面对面的直接交流变得不再那么重要,但由三个方程式构成的克马克—麦肯德里克模型仍可用来研究观点传播。无论人们如何联系彼此,核心模型都能够适用。
我和同事约翰·庞德(John Pound)在1985年对机构投资者和个人投资者进行过一次调查,以期了解他们在做出投资决策时带有多大的系统性。我们请所有受访者回想一下他们最近所做的一笔股市投资,并询问他们是否同意以下有关此笔投资的说法:
我或其他人(使用计算机或其他类似搜索程序)在大量股票中系统性地寻找一只具有某些特征的股票,然后对它产生了初步的兴趣。 [19]
机构投资者中有67%的人同意这一说法,但只有23%的个人投资者同意这一说法。另一项调查的对象是那些投资于高市盈率并且股价飞涨的股票的投资者,我们在调查中提出了同样的问题。在这项调查中,只有25%的机构投资者同意这一说法,而个人投资者中仅有16%同意。
那么,人们是如何开始关注某只个股的呢?答案是口口相传。我们在第一项调查中询问受访者与多少人谈到过该只股票。对于随机样本中的机构投资者,平均答案为7。对于活跃的个人投资者,平均答案还要更高,为20。由此得出的结论是,人们的选择并不都是系统性的:他们会因为小道消息产生非系统性的反应,从而造成关注点的摇摆不定。从投资领域得出的这一认识可以延伸至投资之外的其他经济决策,因为它反映了人类决策的基本模式。有人建议用SIR模型的修改版本来理解人们对单一资产的投资,他们提出证据证明,人们往往投资于地理位置较近的公司,对单只股票的兴趣有时会非常迅速地风行一时,但并不会感染大部分人口(如果c 和r 都很高,或是限定于较小的地理区域,SIR模型就可以套用)。
这类模型可以帮助解释经济叙事传播的地理模式,比如比特币叙事,虽然它在很多国家都具有传播力,但也确实带有地域性。宾夕法尼亚大学沃顿商学院院长杰弗里·加勒特(Geoffrey Garrett)访问硅谷后,在返回的时候谈及了人们对比特币的看法:
虽然华尔街的大多数人都在怀疑和观望,硅谷却全情投入。从最大的科技公司到最小的初创公司,基本上我参加的每场会议都充满了热情而富有创意的有关加密货币的对话。 [20]
观点传播和信息瀑布
SIR模型的变体可能会产生混沌。数学中的混沌理论表明,很多非线性微分方程模型从精确的数学意义上说有可能是混沌的。也就是说,系统可以生成看似随机的变量,这些变量永远不会重复出现;即使系统是确定的,这些变量好像也在生成随机数。事实上,计算机上的随机数生成器并不是真正的碰运气,而是这类混沌的确定性模型的产物。根据数学方法的论证和研究以及实际的疾病数据,SEIR流行病模型的变体有可能是混沌的。 [21]
混沌理论与蝴蝶效应有关,后者指的是一场似乎不可预测的巨大风暴有可能是一件看起来遥不可及、无关紧要的事情引发的,比如很久以前一只蝴蝶在地球的另一侧扇动了翅膀。SIR模型的另一个变体可以通过在基本模型中添加“信息瀑布”帮助解释这种蝴蝶效应。 [22]
如果人们觉得,通过观察有多少人做出某些选择,就可以收集到可靠的信息,那么均衡就会向着随机的方向移动,就像萨尔加尼克及其同事在第4章中所做的虚拟音乐市场实验一样。加州大学洛杉矶分校伊沃·韦尔奇(Ivo Welch)教授是信息瀑布理论的作者之一,我还记得我和他的一次经历。当时,他开车送我回酒店,告诉我他觉得我们就在酒店附近,但他不知道酒店到底在哪个位置。然后他发现了一辆没有乘客的出租车,于是他决定跟着那辆出租车,因为这辆出租车很有可能正在驶向那家酒店。他认为出租车司机掌握着我们所需的信息,这个猜测这一次完全奏效了,但它原本也有可能把我们带到另一家酒店或数不胜数的随机地点。如果很多人都像伊沃那样,那么理论上说,初始的一辆出租车就有可能引发一场流行并导致大量出租车涌向一个随机地点。
信息瀑布可以解释投机泡沫为什么有可能是完全理性的并且符合经济学原理。在我看来,它们很有意思,因为它们描述了在人们相当理性的情况下,泡沫或萧条是怎样从完全随机的原因开始起步的。乔治·阿克洛夫和珍妮特·耶伦在1985年创造了“近似理性”这个词,我真希望这个词在当时更加流行并像病毒般传播开来。 [23]
不过,信息瀑布可能并不是一个特别重要的问题。在现实生活中,出租车司机似乎从不会跟着某辆领头车,至少当他们在本市开车前往目的地的时候不会这样做。但是,就像其他人一样,出租车司机在一些比较模糊的“事实”方面——比如本市的最佳餐厅——可能会效仿其他人。 [24]
你可以试试让出租车司机带你去最好的餐厅:你得到的回应很有可能是一阵笑声,而且你们前往的目的地也不太可能真的是当之无愧的最佳餐厅。 [25]
如果不借鉴叙事经济学,我们很有可能永远都无法真正理解出租车司机的举动,也无法理解消费者、投资者和企业家的行为变化以及其他经济现象。我们需要在叙事经济学领域取得真正的进展,这对未来的研究至关重要。
[1] Miller(2012)根据一个随机模型推导出了该方程,这个模型基于泊松过程并适用于克马克—麦肯德里克模型的各种变体。
[2] 参见Carvalho and Gonçalves(2016),https://arxiv.org/pdf/1609.09313.pdf.
[3] 化学中常用的速率方程与此处所示的三个方程非常相似,不过前两个方程中的SI 在化学方程中仅为一个S 。https://bio.libretexts.org/TextMaps/Map%3A_Biochemistry_Online_(Jakubowski)/06%3A_TRANSPORT_AND_KINETICS/B._Kinetics of__Simple_and_Enzyme-Catalyzed_Reactions/B2._Multi-Step_Reactions.
这里的S 、I 和R 是放在一起的三种化学物质。举例来说,这个模型可被应用于三个元素放在一起的放射性衰变研究,其中S 、I 和R 是元素的数量,I 指中等重量元素,R 是最后一个元素,是稳定的元素。这里也有两个相同的参数c 和r ,S 、I 和R 的图形看起来与此处相似,其中I 呈驼峰状,而且会根据c 和r 的变化表现出快速反应和缓慢反应。但在这个连续化学反应模型中,流行规模始终是100%。化学中还有更多类似的模型,它们涉及化学物质在溶液中配对后的反应。https://www.chemguide.co.uk/hysical/basicrates/arrhenius.html.
[4] SIRS模型与上面的SIR模型相同,只不过要在第一个方程的右侧添加+sR 项,在第三个方程的右侧添加-sR 项,其中s (>0)为再次感染率。在此模型中,根据参数的不同,感染者走势图可能类似于图A.1,但会随着时间的流逝趋向于一条非零水平的渐近线:感染者永远不会全部消失,这种疾病将会成为一种地方性疾病。参见Bredaetal.(2012)。
[5] Grais et al.(2004).
[6] Legrand et al.(2007).
[7] Long et al.(2008).
[8] JSTOR对各个领域900多万篇学术论文和书籍进行了编目,其中只有7%属于商业或经济学领域,但是,带有“ARIMA”、“ARMA”或“自回归”字样的文章却有25%属于商业或经济学领域。
[9] 有时候,人们会用Wold分解定理(1954)证明移动平均模型的合理性。这个定理指出,任何协方差平稳随机过程都可以分解成噪声项移动平均和确定性部分的过程之和。但是没有理由假定ARIMA模型的简单变体会如此普遍。在某些情况下,如果我们将这些误差项或驱动变量表示为已知叙事同步流行的结果,也许能够更好地进行经济预测。
[10] 参见Nsoesie et al.(2013)。
[11] Nathanson and Martin(1979).
[12] Bailey et al.(2016).
[13] Surveyed in Lamberson(2016).
[14] 参见Banerjee(1992),Bikhchandani et al.(1992)。
[15] Goel et al.(2016).
[16] Katz and Lazarsfeld(1955),第44—45页。
[17] Herr et al.(1991).
[18] Bauckhage(2011).
[19] Shiller and Pound(1989),第54页。发给个人投资者的版本中删掉了括号里的内容。
[20] http://knowledge.wharton.upenn.edu/article/is-this-the-end-of-money/.
[21] Rand and Wilson(1991)、Zeng et al.(2005)、Zheng et al.(2015)和Olsen et al.(1988)声称SEIR模型的一个混沌模式与麻疹、腮腺炎和风疹的数据相匹配。
[22] 信息瀑布的基本理念由Banerjee(1992)和Bikhchandani et al.(1992)提出,Vives(1996)以及Banerjee and Fudenberg(2004)对之做出了进一步阐述。
[23] Akerlof and Yellen(1985).
[24] 餐馆选择是Banerjee(1992)提出的典型例子。
[25] Banerjee and Fudenberg(2004)从博弈论的角度研究了完全理性的行为人什么时候有可能会对虚假信息达成共识。