文/老C
1、
前面讨论了两篇文章,研究了一下中国的可支配收入的数据。
周日注册了一个论坛会员,下载了CHIP2013的数据库。
CHIP2013中的可支配收入是按照户统计的,一共是17244户的数据。
每户的人口数量不一样。但详细统计的人头上需要做表之间的勾连,我自己时间有限,就不仔细去分析了。
这1.7万户的收入均值是55348元。假设每户3人,人均收入均值是18449元。这个和2013年国家统计局公布的18311元的人均可支配收入的数字是比较一致的。
1.7万户中,收入最低的是负的15.85万元,最高的是196万元。
小于等于零元的共有85户。占0.49%
户可支配年收入小于1.8 万元(月收入小于1500元的)共有 2754户,占15.97%
户可支配年收入小于3.6 万元(月收入小于3000元的)共有 7317户,占42.43%
户可支配年收入小于5.4 万元(月收入小于4500元的)共有 9130户,占54.95%
户可支配年收入小于7.2 万元(月收入小于 6000元的)共有 13058户,占75.72%
户可支配年收入小于10.8万元(月收入小于 9000元的) 共有15420户,占89.42%
户可支配年收入小于18万元(月收入小于1.5万元的)共有16832户,占97.6%
CHIP2013年户均可支配收入中位数是:42225元。以户为单位的月收入是3519元。
按五等分户:
低收入20%的户年收入均值 12412元
中低收入20%的户年收入均值 27379元
中等收入20%的户年收入均值 42470元
中高收入20%的户年收入均值 64014元
高收入20%的户年收入均值 130445元
2、
2013年-2019年,六年来,我们国家的居民可支配收入是否上涨了呢?
2013年我国国内生产总值568845亿元,人均大概41900元。2019年我国国民生产总值990865亿元,人均7.08万元。人民币计价的人均GDP上涨 69%。
而这六年,根据国家统计局的官方数据,收入均值和中位数都上涨了超过60%以上。
那么,低收入和中低收入群体的可支配收入是否增长了呢?
这个相对复杂一点。
2013年,国家统计局的收入五等分统计是分城镇和农村分配统计的,没有合并数字。而2019年,是合并统计的,没有分开的数字。但可以估算一下。
CHIP数据中也有按户的五等分数据,可以假设一户=3人,也可以估算一下。
2013年全体居民中最低的20%,以农村人口居多,大致是农村的低收入和中低收入组。均值在4000左右比较合理,应该不超过5000。CHIP 2013数据是4137元,算是合理
中低收入的20%,也会以农村居多,大致是农村的中等收入组+农村的中高收入组和城市低收入组的一部分,在9000-10000左右也是合理的。CHIP 2013 数据是9126元,算合理。
基本上,最低收入20%和中低收入的20%,在2013-2019年之间的绝对收入增长在50-80%,应该是一个非常合理的预计。
CHIP2013的户均年收入中位数是42225元,而统计局2019年人均可支配收入中位数26523元。如果一户=3人,户均可支配收入中位数约为7.8万元,增长80%左右。
3、
下面,我们比较一下CHIP2013 (2013年的统计数据)和北师大/财新的数据,以及浙商证券的数字。
北师大的数字
浙商证券的数字
如果假设一户3人。(CHOP20131.7万户的收入均值是55348元。2013年国家统计局公布的18311元,基本上户均收入=人均收入乘以3)。
就是把户均月收入0-1500元,和人均月收入0-500元放在一起。会发现,在低收入群体占比,北师大和浙商这两个所谓2019年的数据,比CHIP2013年的的占比还高。
2013年,CHIP2013数据户均月收入低于1500元的比例是15.97%。
六年后的2019年,人均月收入低于500元的比例,北师大/财新数据是15.81%,浙商证券的数据是17.8%
这个就有点荒谬了。
北师大/财新 和 浙商的数据意味着从2013年到2019年,中国的收入最低的15%的人口,六年来的绝对收入完全没有增长。中低收入的20%,收入增长也很低,这是完全不合理的。
浙商证券的测算,2019年,收入低于500元的人口比例,比2013年还要高?这个不合理吧!
人均月收入1000元以下(户均3000)的比例,CHIP2013 为 42.43%,北师大/财新数据为39.1%,浙商数据位39.4%。
人均月收入1500元以下的比例,CHIP2013 为 54.95%,北师大/财新数据为56.52%,浙商数据位54.8%。
2013年的数据,居然和2019年的数据,分布上没什么区别?这有点太荒谬了吧。
按北师大/财新和浙商的数据,人均月收入中位数都落在1000-1500元区间,都低于1500元。这一点和国家统计局的2019年可支配月收入中位数 2210元也完全不符合。
4、
这里面有一个可能,就是低收入群体的户均人数远大于高收入群体。
比如,如果0-1500元月收入的户,户均人数是正常的1.5-2倍。那么,0-1500的户均收入就应该对应 0 - 250 或 0-300元人均收入这个分类,而不是0-500元。
人均收入低于1000元,应该对应户均收入低于5000元,而不是3000元。这样,在2013年数据中,人均收入低于1000元的占比就是对应户均收入4500元或者6000元。
这样,人均收入低于1000元的比例,才会从2013年的55-75%,下降到2019年的40%左右。
然而,这样还是不太对。
如果2013年人均收入低于1000元的比例大于50%,人均可支配收入中位数应该在12000元以下。
而统计局2013年的数字是,人均可支配收入均值为18449元。中位数应该在15000元以上,低于12000元的可能性非常小。
5、
如果户均人数没有显著差异,那就是北师大/财新 和 浙商证券应该犯了错误。
那在什么地方犯了错误呢。
我这边猜测一下。
浙商的算法有注明,是用了CHIP 2013年的数据库,加上国家统计局的五等分数据做调整,把2013年数据调整到2019年。但怎么调整就没有详细说了。
但2013年,国家统计局的五等分数据是没有全国的,只有分城镇和农村的。
我猜测可能犯了一个如下的数据处理的错误:
分析师直接把城镇低收入和农村低收入算了个加权平均。把这个做为五等分的低收入均值收入,然后和统计局2019年的五等分收入做对比。
这样算的结果是,低收入群体13年的加权平均收入是7339元,13-19年,6年的收入几乎是零增长。
再把这个增长率代入到CHIP2013年的数据集,就得出了2013年到2019年,中国的收入最低的15-20%的人口,六年来的绝对收入完全没有增长这个荒谬的结论。
从而最终得到了一个错误的收入分布。
为什么五等分数据不能直接做城镇和农村的加权平均?这个显而易见吧.....
 6、
《金融时报》也发了一篇文章。
金融时报这篇文章写得还是不错的。但还是存在一个比较明显的错误。人均月收入1000元处于35%的水平,这个推断是错的。
文章使用的是2019年《中国住户调查年鉴》中2018年的数字。其中,中等偏下户,月均每月1177元收入。中等偏下户是收入排名在20-40%的户。这部分户的平均收入是每个月1177元。
在全体居民的收入统计中,由于头部1%的用户的收入非常高,收入均值都比中位数偏高。比如CHIP2013数据中,户均年收入中位数是42225元,均值是55348元。
但如果对中低收入群体来说,因为不存在高收入的1%,均值和中位数是比较接近的。
比如CHIP2013数据中,低收入(底层20%)的户均年收入均值是12412元,中位数是13487元。中位数大于均值。(因为存在负收入的户拉低了均值)。
中低收入(20-40%)的户均收入是27379元,中位数是27274元。中位数和均值几乎一样。
金融时报文章中的结论,月收入1000元在全国的水平是35%,是肯定错误的。排名20-40%的用户的月均收入是1177元。怎么可能排名在20-40%的用户,有15%低于1000元,只有5%高于1000元呢?
2018年的数据,月均收入低于1177元(20-40%组均值)的人口比例应该在30%左右。月均收入低于1000元的,应该在25%的总人口,大概3.5亿人。即使稍多一些,也不应该超过30%,就是4.2亿人。
如果我们用2019年的统计局的数据,更新一下。
低收入组(0-20%)的年收入是7380元,月均收入615元。
中低收入组(20-40%)的年收入是15777元,月均收入1314元。1314元应该是30%的水平
月1000元应该在20-25%这个范围内。2019年,中国低于1000元月收入的人口,应该在2.8 - 3.5亿人之间。
继续阅读
阅读原文