1. 什么是Benford法则
(1)例子:记录全球第一个城市的海拔高度,取首位数字,比如上海平均海拔34米,首位数是3;珠峰8848米,首位数是8。
(2)问题:从数字1—9,出现的频率,是否有统计规律?
(3)答案:满足Benford法则, 令p(n)表示出现首位数字是n的频率,则p(n)的频率是
从图上可知,在自然状态下,首位数是1出现的频率是30.1%,而9出现的频率是4.6%。
(4)Benford定律不适用的情况:
a. 数据量较小:如少于3000笔。如果数据量太小,结果可信度会降低,即结果误差会比较大。
b. 数值范围相当较窄,或是人为指定的;
c. 数据不以概率分布出现。
d. 有人为操控。
(5) 前提条件,若(4.a-4.b)条件满足,而结果仍不符合Benford结果,则可能是(4.c-4.d),可验证数字是否有人为操纵。比如股票的成交量,是否有伪造嫌疑:
a. 若不满足Benford法则,则大概率作假;
b. 若满足,可能数据是真的;或者有高明的骗子作假。
Benford 法则也可广泛地应用于河流长度、城市人口、会计学、金融、选举出现的数据。
比如,华盛顿邮报引用该定律声称2009年伊朗总统大选中有造假。
2. 比较:Trump、Biden的Benford法则:
Trump曲线比较自然接近Benford法则
Biden曲线剧烈振荡,远离Benford法则,即数据异常,用华盛顿邮报的话,是Biden选举数据造假。
图片来源:PRINCIPIA SCIENTIFIC
INTERNATIONAL(在UK合法注册网站)https://principia-scientific.com/joe-bidens-votes-violate-benfords-law-mathematics/
Be the first to comment