Local EPUB Text
本福特法则
1998年5月,财经记者贺宛男发表了重磅文章《东拼西凑的10%》,揭露了许多当年上市公司操纵财务数据的手法。有趣的是,它们的目的都是相同的:千方百计地将净资产回报率做到10%以上。
为什么会出现这种情况?因为当时证监会有规定,上市公司必须连续三年净资产回报率在10%以上,才有资格配股。现在A股市场的主要融资手段是定向增发,而在20世纪90年代,还没有“定增”这个“新生事物”,所以配股资格是决定上市公司能否融资的关键。
2000年,财经作家周俊生在其专著《金钱的运动》中谈及此事。他指出,其实用不着去搜寻具体的操纵证据,只要把所有A股上市公司的净资产回报率数据拿出来汇总一下,立即可以发现:净资产回报率在10%左右的公司数量异常集中。仅此一条,足以说明问题。
图8给出了1998年和2019年的A股上市公司净资产回报率分布。两相比较,可见当年的数据确实异常。
这种不需要微观证据,直接从宏观上给出证明的方法,叫作统计审计,以上只是一个简单案例。统计审计里面还有一个非常强力的工具,叫作“本福特法则”。
图8 A股上市公司ROE分布
本福特法则的内容,可以这样简单理解:把上市公司的历年财务数据拿出来,不论什么项目,统统罗列在一起,只看它们的首位数。应当预期,其中大约有30%是以1为首位数字的。如果不是,那么这一堆数据中,很可能有假。此时你应当警觉起来,准备做进一步的审查。
这是什么道理呢?从数学上说,时间序列数据之间通常存在着一些比较稳定的比例关系。比如说,销售收入每年增长15%左右,净资产每年增长10%左右,等等。那么对一个等比数列来说,显然首位数字出现1的概率是明显大于其他数字的。
你可以这样想,等比数列从1增长到2需要很长的时间,而从2增长到3所需要的时间就短多了,因为基数变大了;从8到9甚至一步就跨过去了;从10增长到20也相对慢,从20到30或者从30到40就相对快多了。从100到200、从1000到2000也都同理。
按照严格证明,对任何一个无限等比数列来说,首位数字出现1的概率大约是30.1%,出现2的概率是17.6%,出现9的概率只有4.6%。当然实际数据不可能吻合得这么完美,所以本福特法则的检验标准就是首位数字出现1的概率大约为30%。
事实上,除了时间序列数据,本福特法则还有更广泛的适用场景。比如说,世界各国的上市公司市值数据也符合本福特法则。
以2020年5月为例,当时美国市场上所有上市公司的市值数据中,以1为首位数字的占29.7%,日本为28.5%,英国为28.4%,法国为29.3%,德国为26.5%,韩国为26.1%,都与本福特法则预测的30%相差不多。我们也可以更换其他时间节点,比如2019年8月或者2009年3月,结论都是差不多的。对于这一点,读者们可以自行验证。
这个现象怎么理解?这说明,如果将一个国家的上市公司视为一个整体,则它们的市值分布存在着一些宏观规律。我们可以用雁群来打比方。在微观上,每一只大雁的飞行固然有其微观的表现规律,有时快,有时慢;但是在宏观上,整个雁群的形态却是稳定的。每当有某几只大雁相对落后时,就会有另外几只大雁向前突进,从而形成一个动态的平衡。
我们可以对全体美股的市值数据取对数,然后分档归类,不难发现,它基本符合正态分布。也就是说,美股上市公司中,市值在1亿美元到10亿美元的数量最多,市值在百亿美元和千万美元级别的数量较少,市值在千亿美元以上或者百万美元以下的就很罕见了。详见图9。
正态分布的数学意义是无穷多个二项分布的叠加,所以我们也可以这样来理解美股上市公司这个群体。假设有数千个企业,最初它们都具有同样的市值,每过一个时期,其中一部分公司的市值会增长,另一部分会下降。经过若干期之后,只有少数公司能够持续上升,另有少数公司将会持续下降,这两类公司构成了正态分布的两翼。而更多的公司表现涨跌互现,它们的市值也因此聚集在一起,形成了正态分布的中腹。
图9 美股市值分布(取对数后)
注:横轴上的数值为市值的对数,纵轴数值为公司家数。
请注意,上述过程决定了一个国家上市公司市值的整体分布形状,它与具体某家公司市值上升或下降的概率无关。在牛市中,每家公司的市值都更有可能上升,但是仍然只有少数能够高速增长,同样也会有少数公司掉队落后,留在中间的总是大多数。所以在整体扩张的同时,它的形状仍然可以保持不变。熊市中的情况也是这样。
当然,我们这里观察的都是全球最大的几个股票市场。在较小的市场中,本福特法则就很有可能不成立了。比如沙特,它的市场结构就不是什么“雁群”,而是阿美石油这一只“大象”带领着一群“小老鼠”。