4月28日,美国达拉斯联邦储备银行研究部高级经济师克里斯托弗·科赫(Christoffer Koch)和英国牛津大学赛德商学院研究员肯恩·冈村(Ken Okamura)联合发表了一篇论文,证明中国没有操纵疫情数字。
这篇被ssrn.com收录的题为《本福特定律和COVID-19报道》(Benford's Law and COVID-19 Reporting)的论文通过研究中国、意大利和美国三个国家疫情的实时数据,发现中国实时播报的疫情数字与美国、意大利的数字一样,其分布都符合本福特定律,不存在疫情数字被操纵的可能。
简而言之,本福特定律(Benford's Law)是指,就具体事件而言,一堆从实际生活得出的数据中,以1为首位数字的数的出现概率约为总数的30%,以2为首位数字的概率为17%,以此类推,越大的数,以它为首的数出现的概率就越低。它可用于检查各项数据是否有造假成分。(Briefly explained, Benford's Law maintains that the numeral 1 will be the leading digit in a genuine data set of numbers 30.1% of the time; the numeral 2 will be the leading digit 17.6% of the time; and each subsequent numeral, 3 through 9, will be the leading digit with decreasing frequency.)
这个定律读起来绕口,但其实并没那么高深莫测。简单说就是:人为修改过的数据不会符合本福特定律。
这篇由英国和美国经济学家联合发表的论文在摘要中开宗明义:
翻译:对决策者来说,对传染病案例实时数据的信任是至关重要的。媒体和政界人士对中国有关COVID-19病例的数据表示怀疑。我们发现中国确诊的病例数量符合本福特定律的预期分布,并且与美国和意大利的情况相似,因此没有发现(中国数据)被篡改的证据。世界其他国家和地区的决策者应该相信中国的数据,并据此制定政策。
该论文表示,中国和美国的数据来自于美国霍普金斯大学冠状病毒研究中心,该中心收集了中国各省和美国各州的数据,而意大利各地区的数据来自于意大利民防部(Dipartimento della Protezione Civile)的每日简报。文章发现,针对中国省份、美国各州和意大利各地区的确诊病例数量,第一位数的分布显示从1到9的下降,与本福特定律的预期分布相符。
论文中还列举了死亡病例、康复病例等其他数字,以及对其真实性论证过程。最重要的是,根据整个论证过程,论文得出了最终结论:
翻译:中国确诊病例的第一位数分布符合本福特定律。因此,我们拒绝中国数据被操纵的假设。研究表明,它也与美国和意大利的分布相匹配。本福特定律的一个优点是:要对虚假的实时数字进行协调基本上是不可能的。虽然确实可以创建符合本福特定律的数据(Diekmann,2007年)。但要以这种方式处理中国数据,需要协调所有省份的每日公告,同时准确预测未来的感染率。这是不可能的。由于中国疫情比欧洲至少早出现一个月,比美国至少提前六周,因此,其数据不仅可以用来校准模型以便采取减缓感染的政策措施,而且还应被用作解除居家隔离令的指导。
也就是说,这篇论文用专业的数据和模型彻底粉碎了中国疫情数字造假论:它不仅指出,现在回过头来看,中国当时实时公布的疫情数字符合该定律;它还指出,想使疫情数字符合该定律而去造假也是不可能的。
论文指出,(某些国家)对中国疫情数字的怀疑可能、甚至已经导致这些国家的决策失误,以及公众不支持政府决策,从而给社会带来危害。文章说,媒体经常宣称中国政府少报、瞒报疫情数字。很多政客也和美国总统特朗普一样,宣称中国数据不可信。正是由于这种不信任,导致欧洲应对疫情行动迟缓。武汉1月23日封城的时候,湖北只有444个确诊病例,17个死亡案例。湖北周边省份立刻采取相应的疫情管控措施——限制人口流动,采取隔离和设立检查站等,同步管控疫情。而回看欧洲最开始的“震中”意大利,2月26日有445个确诊病例,第二天,共有17个死亡病例。然而,意大利在3月9日才开始“封城锁国”,而且国际旅行限制也太温和了。
两位作者建议其他国家根据中国数据,参考中国采取的卓有成效的政策来调整本国对应疫情的方式。
希望某些一直怀疑中国数字造假的政客能摒弃意识形态偏见,真正以全人类的生命安全和利益福祉为重,行动起来,把疫情对人类的影响降到最低。