闲谈

体育老师填了统计数据。。。

我们都知道,统计学是一门博大精深、应用范围极广的综合性科学,学好统计学的前提是要有优秀的数学基础,换句话说,这是一门对“数学是体育老师教的”的学渣不太友好的学科。但是,今天的一个新闻打破了小组对于统计学的印象。根据国家统计局最近通报的一起经济数据“严重失实”案件,云南红河的泸西、建水两县经济普查数据严重失实,其中统计数据上报的过程包括了:“教育体育局编造并代填代报四经普固定资产投资项目数据”——原来体育老师也可以来做统计工作!

地方经济数据不实并不是什么新鲜的话题,前几年,相继爆出了辽宁、内蒙古、天津的经济数据注水问题。其中内蒙古一次性核减了40%的工业增加值,调减了1/4的财政收入。天津更加玄幻,在调整之前,天津滨海新区拥有一万亿的经济总量,超过上海浦东新区,是中国第一区

有趣的是,天津滨海新区的GDP占了天津的56%,滨海新区挤掉了30%的水分,但是2017年天津市GDP并没有大幅下滑。这是因为国内经济数据统计有一个默认的规律:各省公布的GDP相加,会比国家统计局公布的全国总量数字多;各个市统计的GDP相加,会比省统计局公布的全省总量更多。所以,天津经济总量是多少还是要看有关部门公布的数字。

而这次通报的云南红河事件,又将这种统计数字的内部不合理性揭露了一遍。

红河是云南省下属的自治州,而本次通报数据“严重失实”正是红河下属的泸西县和建水县,其中,泸西县今年刚退出贫困县。作为一个前贫困县,从2002年到2016年,泸西县的固定资产投资完成额年均复合增速达到46.5%,远高于云南省全省的增速24%,而建水县的增速也是类似的情况,年均增速达到了47.5%。

这么高的投资增速,两年就能翻一番,当地ZF贼有钱,脱贫岂不是分分钟的事?

在这次的通报中,除了固定资产投资,还提到了两地规模以上工业数据“严重失实”。在生产活动,与工业生产高度相关的一个指标就是发电量。可以看到,建水县在每年发电量基本没变的情况下,实现了工业总产值年均增长24%,并且,持续增长了12年。

明显不合常理嘛。新开工厂机器不开也就罢了,黑灯瞎火的怎么干活?

简单的统计数据里藏着人性的故事。经济数据之所以注水,主要还是一些官员为了政绩。就像当年辽宁省总结自身教训所说的——“官出数字、数字出官”。所以不管是哪个省,自爆数据存在问题不出意外都发生在领导换届以后。

不过有的好大喜功,有的则不敢露富。前者多报、虚报,后者漏报、少报。2004年全国第一次全国普查,就揪出一群藏着掖着的省份,广东GDP藏了2800亿元;浙江藏了400亿;上海藏了600亿;北京藏了1800亿。

这些大胖子藏着肉,目的很简单,少上交呗。

这些数据不实的问题除了被统计局揪出来以外,我们有没有可能自己发现问题?

有些是可以的。通过多个数据源的加总、作差等运算后比对,有时会发现问题,比如我们在前面说的地方政府统计数据加总成全国数据是否对的上;或者通过相关度较高的不同类型数据进行比对,比如上文的规模以上工业总产值和发电量的对比;还可以通过一些逻辑判断,比如根据所在城市的经济发展状况,这个数据是否符合常理,增长率是否畸高等。

关于鉴别统计数据的问题,小组曾经写过多篇文章,比如????《统计局的数据究竟怎么了?》,为什么统计局在算利润增长率的时候,会有一个明显的“错误”,后面代表了一个什么样的经济图景。

再比如????《物价飞涨,统计局和央妈,信谁的?》,对于今年的物价上涨,统计局淡定,央妈忧虑,到底信谁?

我国幅员辽阔,人口众多,统计局的工作的确不好做。中央也算下了苦功,地方的数据能不用都不用,全国经济普查也是如履薄冰,在各地派驻人员直接负责数据采集。但即便这样,还是挡不住一些老鼠屎。

无论是证券投资还是实业投资,通常会按照自上而下的思路进行研究,而各类统计数据就是研究分析和做出决策的基础。在这种情况下,对于数据的可得性和可靠性,还得自己多想点法子。毕竟要是数据有瑕疵,导致自己的投资决策失败,还是得自己给自己负责呢。