Local EPUB Text
1835年
普通人或典型人、正态分布、概率在社会科学中的应用
凯特勒(1835)首次提出了“普通人”概念,普通人成为社会科学领域最著名的虚拟人物。凯特勒根据100000个法国士兵的平均身高和体重构建了他的普通人。他还更深一步,根据这些士兵的拘捕记录推出一个普通人的犯罪倾向。普通人的概念在金融经济学发展史上发挥了重要作用,其影响时间长达一个世纪之久。该概念后来发展为人们熟知的“典型人”。
凯特勒的第二个重要贡献是,他认为许多自然过程都符合正态曲线。我的学生卢卡·巴龙告诉我,我们其实应该感谢柏拉图(公元前427年—公元前347年)。如果我们从更深更广的角度去理解柏拉图的作品,我们会发现是柏拉图首次描述了单峰对称频率分布,而且他相信大多数特质都是按这种方式自然地分布的:
……因为经验会告诉他事情的真实情况。善良与邪恶都是极少见的,绝大多数人都是处于这两者之间。我的意思是……你可能想说非常高与非常矮——非常高与非常矮的人同样是很少见的。这种特征基本适用于所有的极端情况,不管是大与小、迅速与缓慢、正直与邪恶,或者黑与白。也不管你是分析人、狗或者任何事物,你都能发现极端的情况总是极少数,更多的情况是位于中间。见《西方世界的伟大著作,第1卷:柏拉图篇》(Great Books of the Western World:Plato,Volume I:Phaedo),Franklin Library,1979年,pp.385~439,尤其是p.415。
凯特勒为正态分布增添了更为具体的特征 6,观察到他的结果有个重要前提,那就是除了在被考察的差异唯一来源上,样本在其他各个方面都必须足够同质化。凯特勒对他的正态法则非常自信。因此,当他观察到身高最低的那个士兵组的人数竟然多于身高较高组的人数时,他就指出,由于服兵役是自愿的,身高最低组的士兵人数较多就证明了大约有2000人欺骗性地回避了征兵。
1843年,安东尼·奥古斯丁·古诺(1801年8月18日—1877年3月31日)表达了对将概率论应用于社会科学的严重担忧。 [21]令所有人都很惊讶的是,在1838年古诺就将数学分析方法引入经济学。他的观点与他1838年的书一样,都远远领先于那个时代。可是问题出在选择可验证假说上。古诺认为,社会科学提供了大量挑选与划分数据的方法,结果造成某些样本看起来支持假说,而且碰巧验证结果在统计上非常显著。但其实这一结果并不可信。他写道:
很显然,随着我们将样本划分得越来越细,就概率而言,我们就越有可能得到至少一个小样本其男女出生比率明显不同。
古诺还特别担心人们极易在挑选数据之后再选择假说。现在对这类错误我们有个名词叫“数据挖掘”。
亨利·托马斯·巴克尔的观点则是另一个极端。他表示:期待有一天,统计学的力量能融入社会科学,通过数学的运用让社会科学也能得出像物理学一样精确的预测度。 [22]显然,日后的发展证明,实际情况介于古诺与巴克尔的观点之间。不过在20世纪中叶,最著名的科幻小说家艾萨克·阿西莫夫(1920年1月2日—1992年4月6日)在其小说《基地三部曲》(The Foundation Trilogy)(1951~1953)预测,大规模应用的社会统计方法将对几百年后的主要社会趋势做出预测。