作者:chenqin
来源:城市数据团
文章已获授权

写在前面

如果说全国人民的春节联欢晚会在除夕夜,那么统计数据的春晚,就是每年1月的国民经济运行情况新闻发布会了。这场数据春晚每年准时为大家提供一年一度的新谈资,在各种数字中,最让大家翘首以盼的数字可能并不是GDP增长率,而是人口,或者说,出生人口。
每年正式公布出生人口之前,往往各路人马都会拍脑袋猜一猜最终公布的数字。在这一片热烈祥和的竞猜气氛中,2023年的人口数据出炉了——2023年全年出生人口902万人,人口出生率为6.39‰,年末总人口比2022年末下降208万人
在这些数字公布之后,往往都会直接冲上各大平台热搜,引来无数专家学者的“热议”,并霸占各大媒体版面前排位置。数据团也曾在两年前的此时,发布了一篇讨论出生人口的文章。实际上,两年之后再来讨论出生人口现状,我们的观点几乎没有变化。但城市数据团编辑部同仁们仍然认为有必要用更新、更全面的数据,再一次分享我们的观点。
“人口焦虑”大可不必,接受现实,放弃幻想,积极应对。

发布会的人口数据,只是暂时的数字

诚然,如果将2001到2023年历年在国民经济运行情况新闻发布会人口出生数字画在一张图上,视觉冲击确实很大。出生人口在1600万-1800万之间保持了16年后,从2016年开始骤然下降,到2023年的短短7年,出生人口下降几乎一半。
在如此强大的视觉冲击和数字佐证下,人们很难不用各种负面词语来描绘当前的人口出生图景,进而引发热烈讨论,甚至是人口焦虑。
但需要注意的是,“在国民经济运行情况新闻发布会”上发布的出生人口、同时也是历年统计公报发布的出生人口,仅仅只是诸多人口统计口径中的一种。
这个数字,是根据每年11月1日的人口动态抽样调查数据推算出的每年出生人口。每年的抽样调查样本约为全国总人口的千分之一。这个版本的出生人口数据,会在整十年的人口普查后经历大幅度的修订,甚至在普查修订前,人们就已经发现了这些数据存在与客观事实的偏差。
举个例子,该口径统计数据与后续修订的最大偏差,出现在2012年。
2012年,统计局的国民经济运行情况新闻发布会和稍后发布的《2012年国民经济和社会发展统计公报》都明确显示,2012年,中国全年出生人口1635万人,出生率为12.10‰。
7年后,2012年出生的人口上应该小学了,奇怪的事情出现。由教育部发布的《2019年全国教育事业发展统计公报》却显示,2019年小学招生1869.04人。
在2020年普查中,2012年出生的人口在当年为8岁,因此普查的8岁人口应当和2012年出生人口数字差不多。但在《中国人口普查年鉴》的短表3-1中,8岁人口为1935.37人。
从1635万,到1869万,再到1935万,2012年出生人口如何越活越多,甚至多出来三百万人?
必定是有一个数字错了。而随着2012年出生的这批孩子进入幼儿园,进入小学,再进入初中,越来越多的现实数据表明,错的正是2012年在国民经济运行情况新闻发布会上通报的这项全国人口。
于是我们便看到了人口出生数据的修订。
在《中国统计年鉴2013》中,2012年的人口出生率为12.1‰。
经过第七次人口普查调整后,《中国统计年鉴2022》中的2012年人口出生率,已经变化为14.57‰。按照这个出生率计算,2012年出生人口等于1980人,是2010年到2020年之间出生人口最多的一年。
所以,如果你要问2012年出生人口到底是多少,这个答案可能会有很多。在2013年伊始,我们曾经以为它是1635万人,但2023年回头再看,它似乎应该是1980万人。
未来会不会继续修改呢?很有可能。因为每年都有人口动态抽样调查,每十年、每五年还会进行大小普查,这些调查也总会引入新的调查手段,这些新的统计手段也会使得新的人口数据出现变化。
下图列出了使用不同数据来源计算的1986年到2022年每一年“人口出生数”,其中虚线表示的是当年的统计公报报告的初始数值,两条粗线表示2010年和2020年两次人口普查的分年龄人口,可以推算出的当年出生人口,其余细线表示2011到2022年历次人口动态抽样调查的分年龄人口可推算出的人口数据。
不难发现,统计公报值(虚线)在1990年到2004年的出生人口统计显著高于后续的普查和抽样调查推算出的对应年龄人口数。但在2004年到2015年,又显著低于普查数据对应年龄人口数,两者的差异动辄上百万,甚至数百万。
不仅如此,抽样调查与抽样调查之间,抽样与普查之间,甚至是普查与普查之间,人口出生数的差异也不小。
——2010年六普中2008年和2009年出生的1岁和2岁人口为1570万人左右,但在2020年七普中,同样是2008年和2009年出生,只不过成长到了11岁和12岁的人口,就上升至1738万和1772,后者比前者高出近200万人。
人口统计数据,是一个会变化的数值。由于技术手段的变化,我们可能会不断修正对真实人口的计算,并且随着时间推移,得出全新的结论。
最近一个可能让我们认知更新的数字更新案例,就发生在过去两年。
——2021和2022年的统计公报分别显示,2021年的出生人口为1062万,2022年出生人口为956万人,2022年的出生人口比2021低106
但《中国人口和就业统计年鉴2023》却显示,在人口动态抽样调查中,2023年的1岁人口(2022年出生)的占比要比2岁人口(2021年出生)的占比更高,用抽样调查计算出的分年龄人口占比乘以当年总人口,2022年出生人口比2021年出生人口多103万人
2022年的出生人口,是比2021年下降了100多万,还是比2021年回升了100多万?就算只过去了短短一年,我们可能就有了更新的结论。
因此,每年在公报发布后讨论出生人口的百十来万的变化,实在没有必要。

出生人口总量下降,但个体生育意愿其实还在提升

分析人口出生数据,我们往往会陷入总量的对比中,并在其中得出一些毫无意义的结论。
比如常有人说,出生人口暴跌了,是因为人们“不想/不敢/不愿”生孩子了。举个例子,在某一个状态下,某个人要生2个孩子,在状态改变后,这个人改变了主意,打算只生1个,甚至不生了,这个变化,可以归结为“不敢/愿/想生”。
但“不敢/愿/想生”的因素,在人口出生下降的过程中,到底起到了多大作用呢?
第一,正如之前在《人口生命周期的力量》一文中提到的,人口的周期是会自我复制的,因此讨论出生人口的变化一定要首先观察25年前的人口变化,尤其是其中女性数量的变化。
上图显示了2020年人口普查数据中历年出生的女性人口数据:
  • 1990年出生(当前34岁)的女性人口为1251万人;
  • 在短短9年后,1999年出生(当前25岁)的女性人口就只剩654万人;
  • 2003年出生(当前21岁)的女性人口甚至进一步降低到了633万人。
近30多年前的出生人口在短短9年中快速减半,那么当这些人口进入生育高峰期窗口时,即便每个出生人口的生育行为完全不变,出生人口也必定减半。这并不涉及“不敢/愿/想生”的因素,而是一个简单的数学计算,也是一个20年前就可以完全预期到的,必然到来的现实。
第二,如果排除了人口总量的影响,每个人“不敢/愿/想生”的因素,在最近十年来的人口出生锐减中,又到底起到了多大的作用呢?
我们可以首先想象这样一个问题——
有两个人,其性别、年龄、婚姻状况、教育程度、既往生育等特征完全一样,只是一个生活在2010年,另一个生活在2022年,那么这两人眼下的生育行为,是否会有差异?
只有回答了上面的问题,我们才能排除所有的总量、结构指标,看到人们的微观生育选择。
我们使用2010年人口普查微观数据以及CFPS数据完成这一项计算。
2010年人口普查的长表中对15-50周岁女性的生育状况有较为详细的问题,见下图。
在上图的基础上,我们可以计算出每一名被调查女性的当前人口特征、过往生育情况、过去12个月的生育选择。
另一套数据来自2010-2020年的中国家庭追踪调查数据(CFPS),CFPS数据的家庭关系表详细记录了每个人的个人特征和子女特征。此外,我们还可以通过每个人的被访问时间以及是否有子女、每个子女的出生时间等信息还原出被访问者在过去12个月内的生育选择。
举个例子,如果一个人的被访问时间是2023年7月,且有一名出生于2023年1月的子女,那么这个人在过去12个月内就有过生育。
接下来,我们将2010年人口普查与CFPS数据合并,并用probit模型估计下式:
可以得到以下回归结果:
上述结果中有几项比较值得注意:
首先,在其他特征相同的前提下,教育水平越高,过去12个月内生育的概率越低。在其他个人特征相同的前提下,相对于未受过教育的人口,受过高等教育的人口的12个月内生育概率会降低一半左右。这也是家庭经济学中的经典结论之一——教育水平越高的女性,生育的机会成本越高,因此会更减少生育。
其次,如果之前曾经生育过一个男孩,那么12个月内生育的概率会降低61.3%,如果曾经生育过一个女孩,那么12个月内生育的概率只会降低35.6%。这显示了在已有男孩/女孩的前提下,人们是否会多生一个孩子的决策还是会有很大差异。已经有男孩的家庭会比有女孩的家庭更不倾向于生育二孩。
第三,也是本文想要讨论的最重要一点——不同时间范围内的生育决策。
从上图可以看到,从2010年到2020年,在其他个人特征全部相同的前提下,人们的生育概率事实上是先提升,再下降的,最高点在2018年,随后在2020年快速下降。2014到2018年的生育概率上升,可以理解为从单独二孩到全面二孩等政策改变造成的存量生育意愿释放,而2020年的下降,则是政策变化的存量红利耗尽,生育水平回到了正常水平的结果。
而从图中我们可以看到,2020年的生育概率数值,比起2010年和2012年更大。这说明什么呢?我们可以打一个比方:
某人他在2020年做了一个生育决策;平行宇宙下,各项特征完全一样,但穿越到了2010年或者2012的另一个他,也做了一个生育决策。两者相比,身处2020年的他,将会比身处2010年、2012年的他,有着更高的生育概率。
正如我们前面提到的,在统计数据修正后,2012年出生人口达到了1980万人,而2020年的出生人口1202万人,2020年的出生人口要比2012年低39%。但前文的计算结果告诉我们,如果要比较同样特征下每一个人口的生育概率,反而是2020年要比2012年更高。
这意味着,从2012年到2020年的人口出生快速下降,起到最主要作用的,依然是30年前的那条人口曲线,而不是我们每年都在讨论的 “人们今年更加不敢/愿/想生”。
而以十年的跨度来看,人们从2010年到2020年反而更加敢/愿/想生育了。

出生人口下降,其实是总体人口教育水平变动的结果

前文的计算使用了CPFS数据和2010年人口普查微观数据,使用2020年人口普查的汇总数据,我们也能得到类似的结论。
我们使用六普、七普的长表3-2与长表6-2,计算不同年龄、教育程度的女性在2010年和2020年的生育决策变化。
上图画出了2010年和2020年人口普查中各教育程度的女性的生育率。可以看到,不管是初中学历的分年龄生育率,还是大学本科学历的分年龄生育率,2020年都要全面超越2010年,这与我们从CFPS微观数据得到的结论一致——如果比较同样年龄、学历的人口,那么2020年总是要比2010年的生育率更高。
那么接下来就面临另一个问题:
中国的出生人口确实下降了,相比人口出生的最高峰2012年,2023年的出生人口已经出现了超过53%的跌幅。既然三十年前的那条人口曲线中的育龄女性只下降了不到一半,而每个同样特征的人口生育概率也并没有变得更低,那么为何出生人口下降会超过三十年前的降幅,超过一半呢?
这正反映了人口受教育结构变化产生的“辛普森悖论”,我们将两个年份的20-24岁女性人口和25-29岁女性人口的受教育结构放在一起,可以得到以下两图:
以上两图,显示出了2010年和2020年巨大的教育结构差异:
  • 2010年时,20-24岁人口中比例最高的还是初中学历人口,达到了47%,而2020年时,20-24岁人口中初中学历人口的比例降低至20.2%;
  • 2010年的20-24岁人口中仅有27.3%的大专、大学和研究生以上学历人口,该比例到了2020年变成了61%。
  • 同样的变化也在25-29岁人口中出现。初中生比例从53%下降到32%,而高等教育学历以上人口比例从21.3%上升至45%。
在前文中我们可以看到,受过高等教育的人口,其生育概率要比没有受过教育的人低一半左右。在分年龄各学历人口的生育率对比中,我们也能明显看到本科教育水平的生育率要比初中教育水平的生育率低40%。
可以算出,从2010年到2020年,即使同样特征的人口的生育率不变,仅仅因为教育结构的改变,就会使得20-34岁人口的总生育水平下降7%
而教育结构的变化,在2020年远未结束,在2025年,新进入生育年龄的人口的高等教育比例会从60%提升至70%以上,此时的生育率将进一步被拉低,由于教育结构变化导致的生育水平下降会达到10%以上

后记:人口趋势的变化,需要不止一代人

从2010到2020年的真实出生数据中,我们并没有发现中国的生育水平出现下降,反而在同样教育、年龄的层面上,2020年的人口微观生育水平比起2010年和2012年有所提高。
但在另外几项原因的影响下,总出生水平却快速下降了。
1,1987年到2003年的人口快速下滑,是近十年来出生人口下降的最主要原因。育龄高峰期人口减半,子女数量自然也会减半。这是深埋于历史的原因,我们无法改变。
2,教育结构的变化,让高生育率的群体比例减少,而低生育率的群体比例增加,在每个教育程度的人口生育水平都提高的情况下,总生育水平却下降了。相比过去,女性获得了更好的教育机会,这是时代的发展、社会的进步。
3,政策红利拉高了2014-2018年的生育率,短期释放了积压的存量生育意愿,积压的存量生育意愿消耗完毕后,2019年后的生育率向下恢复至正常水平,虽然仍然比2010年更高,却低于2016、2018年,客观上加速了这几年的出生人口下滑。
不难发现,当前我们看到的现象,是过去几十年各项人口变量共同发生作用的结果,既有过去政策的长期影响,也有社会发展的进步的结果,短期因素(比如二孩政策红利结束)的影响并不是主要原因,更加不是由于这一年或这几年的经济好了/差了导致今年人们更想/更不愿生育的结果。
我们必须清楚地认识到,人口问题研究的初衷,并不在于人口数字本身,而是为了所有的人都能获得更好的生活。从上面的分析来看,出生人口变化是一个应该被接受的“现实”,而不是一个亟待“解决”的“问题”。
一个已经进入育龄的成年人,可能会因为短期因素推迟/提前生育,但是他的人生安排,是很难被彻底改变的。出生人口相关问题上不存在“速效”政策。人口趋势的惯性仍将在未来几年内持续发生作用,并使得出生人口进一步下降,我们在这样的现实中,不应该抱有任何幻想。
诚然,人口老龄化和出生人口下降会对社会经济发展的方方面面产生影响。这一过程中,需要始终关注一个个活生生个体的生活和发展,努力寻找长期的人口发展目标和其他短期政策的均衡点。
期待在今天做出的努力,可以让几十年后的人口趋势,出现一些新的改变。

继续阅读
阅读原文