Memo_A Guide to Global Population Projections
O’Neill B.C., Balk D., Brickman M., et al., 2001, “A Guide to Global Population Projections”, Demographic Research, 4, 203—288.
这篇论文的前三个作者O’Neill现系马里兰大学全球变化研究所主任,撰写此文时在布朗大学,其近期工作主要是评估气候与人类系统;Balk现系CUNY人口所主任,撰写此文时在哥伦比亚大学,其近期工作时城市化、健康与环境尤其是气候变化;Brickman现系纽约科学学院(New York Academy of Sciences)生命科学系主任,其近期工作时健康、城市化研究,撰写此文时也在哥伦比亚大学。该论文概述了2000年以前人口预测的基本方法,尽管与最近廿年的发展有所滞后,但仍然具有指导意义。
中国国家统计局2023年1月已经公布,2022年中国人口历史性的开始了负增长,出生人口为956万人,死亡人口为1041万人,人口比上一年年末减少85万人。2022年末人口14.12万亿。应当说,尽管本文在千禧年的预测已经低估,但据我在2022年中的查询,较新的国际预测仍然低估了中国人口峰值的时间,可见表1所示,国际机构的各类预测大多是2030年前后,且最低的峰值也比实际高出了约1000多万人口。如何理解这些预测结果,这篇文章提供了主流预测的具体过程,或将促使人口学家未来进一步转向最近廿年概率性的人口预测方法。
表1 国际机构的中国人口峰值预测时间
顶峰时间 | 数量 | |
---|---|---|
United Nations | 2031 (MEDIUM VARIANT, Medium fertility variant) | 1 464 418 000 |
2027 (NO CHANGE, constant-fertility and constant-mortality) | 1 454 680 000 | |
WB | 2030 | 1 433 473 000 |
IIASA/WIS | < 2030 | 1 379 000 000 (*2020) |
USCB | 2030 | 1 424 439 125 |
注:网页信息截至2022年5月3日晚。
论文内容包括:为什么要做预测?哪些组织在做预测?怎么做预测?即Why、Who、How。其中How(怎么做预测)是核心部分,具体又包括,第一,预测的方法,CCM与其他替代法,如何预测不确定性?第二,预测的假设,生育、死亡及移民参数如何确定?第三,预测的结果,如UN的情景法普遍低估生育率下降速率。其具体内容如下。
一、人口预测的受众与组织者
第一,论文区分了预测(Project)与预报(Forecast)。预测是假设一组未来的生育率、死亡率和移民数量,计算这些假设的数字结果,而不负责各假设得到的结果的可能性。预报则是最可能的预测,就像天气预报。
第二,论文指出目前预测的主要受众,商业公司用于营销、政府机构用于规划、全球研究机构用于研究。尽管不确定性会随着时间范围增加而增加,人口学家往往被要求去预测几十年后的事情,这使预测经常不准。
第三,论文指出目前人口预测的组织者,以及最近的预测方案,本文按其更新了2022年的预测情况,如表2所示。论文撰写时(2001年)预测与现在预测有几个区别。其一,2001年预测大多是到2050年,2022年预测则更新至2100年;其二,2001年预测会包括大洲(Regions)与国家两个层级,2022年预测则一般直接细化到国家;其三,2001年预测情景很多,有机构预测了27个情景,2022年预测则相对少了很多,但出现了更多的概率性预测。
就2001年预测而言,第一,UN预测方案是World Population Prospects,1951年至今。第二,WB预测方案是World Development Reports,1978年至1997年,1997年后WB不再专门预测,且如今WDR也不再专门出版。第三,IIASA的预测没有固定名字,1994年至今。第四,USCB的预测World Population Profile,1985年至今。第五,PRB的预测,World Population Data Sheet,2000年至今。
表2 2022年查询人口预测机构及其预测方案
Organization | Recent Projection | Time Horizon | Level | Method | Output Scenarios |
---|---|---|---|---|---|
United Nations | 2019 | 2100 | Country | CCM & Probabilistic Projection | 9 |
WB | 2022 | 2050 | Country | / | 1 |
IIASA/WIC | 2014 | 2100 | Country | MCCM (Education) | 3 |
USCB | 2020 | 2100 | Country | CCM by DAPPS (2021) | 1 |
PRB | 2021 | 2050 | Country | CCM | 1 |
注:网页信息截至2022年5月3日晚。
二、人口预测的基本方法
2000年时,人口预测方法已经和现在基本一致,只是概率预测在近年得到了进一步发展。具体而言。
第一,队列要素法(The Cohort-Component Method)最常见。其最初在1895年Cannan提出,1945年Leslie矩阵化,并同年被Notestein用于人口预测。CCM的未来预测取决于期初的规模、年龄结构,以及设定的生育率、死亡率、迁移率等参数。但是,作为主流的CCM预测存在较大问题。其一,不清楚各情景在多大可能会出现。其二,确定参数往往很主观,不同专家往往有不同意见。其三,各参数的组合排列可能并不科学。其四,参数在各地区过于一致,对各区域往往被简化为一个作用方向。
第二,替代CCM的方法。其一,时间序列法(Time Series),这个方法有三个问题,预测无法考虑到技术发展的影响、难以预测反向的人口减少、随着时间增加置信区间快速变大。其二,微观仿真法(Microsimulation),该方法预测精度高,但问题在于数据要求高、方法要求高。其三,系统动力学模型(Structural Models),通过经济发展程度等指标来预测,其代表如1970年代的Word3模型,但问题在于指标缺乏理论支持,主观性强。
第三,MCCM方法(Multistate cohort-component projections)。其最初是为了测量家庭成员居住模式,其后被应用到各领域,如Lutz与Goujon的全球人口教育预测、Van Lmhoff与Keilman的荷兰婚姻预测。该方法可以被视为CCM的进阶,只是参数更加复杂。
因此,上述方法均有各种问题,学界开始探索第四种方法,即概率性预测(Probabilistic Projections)。就概率性预测而言,有三种具体方法,其一是专家给出可能范围,但专家人工判断不可靠。其二是根据历史误差分析,如NRC(2000)报告Beyond Six Million,根据UN先前预测误差去修正后续预测。其三是统计模型,但2000年刚刚开始,事实上,这一方法如今已经被UN 2019的World Population Prospects采用(盛亦男、顾大男,2020),且日益重要。该方法的问题主要在于,概率是无条件的,但政府报告里不好讲故事,这需要组合使用CCM这种可以分条件讲故事的方法。
最后,论文总结了人口预测的原则,其一,尽量多种方法交错观察。其二,使用CCM时要清楚预测情景(或参数)隐含的假设是什么。其三,概率预测可以辅助判断CCM。
三、人口预测的参数估计
就CCM中各参数的估计而言,论文讨论了基础数据、生育率、死亡率、移民数量。具体而言。
基础数据方面。普查仍是主流,但普查的问题是,在发达国家中移民数据匮乏,在发展中国家中往往仍依赖间接估计。
生育率方面。参数取决于下降速度与最终水平。现有参数考虑往往依托人口转变理论、家庭政策理论、TFR时期效应等,但论文认为没有考虑气候、环境变化的影响。其比较了2000年时各机构的参数设置,共同点是均认为TFR会下降,但下降速度不一,以巴西2050年为例,UN认为会下降至2.1,USCB认为会下降至1.7。
死亡率方面。参数取决于死亡人口的年龄分布及预期变迁。现有参数考虑往往依托预期寿命是否有增长极限、艾滋病的影响有多大,但论文认为没考虑(1)环境承载力,问题是难界定、难测量、难厘清因果,(2)气温与死亡率,如登革热等流行病传播。其比较了2000年时各机构的参数设置,如UCSB认为受HIV影响,对后发国家预测更保守。
迁移人口方面。1990年代初,国际净移徙已占千年发展目标人口增长率的近一半,数量庞大。现有参数考虑往往依托推拉理论,尤其在经济上,移民更可能来自有一定发展的国家、及这种国家中的中产;此外,政治避难、文化、社会网络等因素也被考虑,但论文认为未考虑生态难民,据Myers(1995)估计有2500万生态难民。其比较了2000年时各机构的参数设置,UN在短期预测中设置移民数量有三类国家(从来没有0、中短期有、一直有),UN的长期预测都是0;IIASA则按照近期历史数据与Rogers & Castro 迁移年龄模式;USCB预测则按0或逐渐归0,该预测会导致区域有不平衡,但总体可以忽略不计。
四、人口预测的结果讨论
最后,论文讨论了各机构的预测结果。从数量、年龄结构、分布、精度四个方面。
第一,就全球预测的数量而言。2050年UN值为8.9 billion、USCB值为9.3 billion、IIASA值为9.9 billion;2100年UN值为9.5 billion、IIAS值为10.4 billion。
相对而言,IIASA比UN预测值高,可能是基期数据的TFR高,而UN后来校正了TFR;IIASA预测范围比UN小,可能是因为IIASA的TFR与Mx一起变化,如果固定Mx则IIASA的范围也很大。但是,各机构的国别预测差异大,全球或大洲的汇总数据掩盖了国别预测参数的差异。
以UN预测为例,其一,各情景的人口惯性(Momentum)不一,主要是因为短期看TFR,但长期看TFR是否回弹所带来长期育龄妇女数量是否减少。其二,各预测的相对增长率在1960年代达到峰值2%,至2050年在-0.2%到0.9%之间,绝对增长量在1980年代末达到峰值,约8600万,至2050年绝对数量的预测差异极大。其三,对比1994、1996、1998年三次UN预测,TFR在持续下调。
第二,就年龄结构而言。UN、IIASA中方案显示,2050前后老龄人口比重超过少儿人口比重,乐观预测2100年才会超过,悲观预测2030年就会超过,预测区间很大。
第三,就人口分布而言。其一,2008年开始城市人口超过农村人口,2030年城市人口占总人口60%,但后发国家城市化率仍然很低。其预测所采用的城市化速率参数,按世界常态进行调整,即logistic的S曲线。其二,发达地区(北美、大洋洲和欧洲地区)人口数量从18%降至10%,中国从21%降至14%,非洲从13%增长至24%。
就上述预测是否准确,论文回测了历史数据。数据显示,以往预测均高估,主要是因为高估了后发国家生育率,低估了死亡率的下降速度。但具体分地区数据显示,UN预测上调了中国1965至1970点TFR、下调了非洲1985年以后的预期寿命。同时,2000年预计的城市人口比1980年预测的少了约10%,城市人口数量高估主要是因为城市化速率高估。
参考文献
[1] 盛亦男、顾大男,2020:《概率人口预测方法及其应用——《世界人口展望》概率人口预测方法简介》,《人口学刊》第5期。