Professional Documents
Culture Documents
"三年自然灾害"真的饿死3000多万人吗 - 对茅于轼先生《饥荒饿死人估算方法》的验证 李闽榕
"三年自然灾害"真的饿死3000多万人吗 - 对茅于轼先生《饥荒饿死人估算方法》的验证 李闽榕
1 2
李闽榕 ,万克峰
摘要: 茅于轼先生《饥荒饿死人估算方法》在样本选择、模型构造与计算分析两个方面均存在不足。即使根据
茅先生的分析逻辑,分别利用 4 类回归算法对人口总量进行估算,茅先生的二次多项式回归方法并非最优。而且,
茅先生的人口波动正常年份选择方法不准确。基于凝聚聚类算法识别人口波动正常年份,计算得到正常年份人口
计量指标,进而估算“三年自然灾害”饥荒饿死人口数量,结果表明“三年自然灾害”期间,全国非正常死亡 1242. 63
万人,少出生 2193. 31 万人,导致全国总人口减少 3435. 94 万人。这与茅于轼先生计算得出饿死人数 3000 多万的
结果,相去甚远。上述方法可用于估算突变年份的突变人口,对非正常人口增长与非正常人口损失具有一定的可
操作性。
关键词: 三年自然灾害; 人口波动; 人口增长; 人口损失
中图分类号: F326 文献标识码: A 文章编号: 1005 - 2674( 2013) 12 - 083 - 07
一、《饥荒饿死人估算方法》的方法科学吗?
[1]
茅于轼先生在《饥荒饿死人估算方法 》 一文中,利用 9 年 ( 1950—1958 年 ) 的人口数据作为训练样本
构造二次多项式回归模型,即用 9 年的人口总量数据来推导、估算 1959—1961 年的人口总量。 即使模型实
现了高度拟合的训练目标,其估算精度也通常无法保证。这种模型的分析结果,显然不能作为确定性的估算
结论,甚至是否具有参考价值都值得考问 。
1. 确定正常年份和非正常年份的方法不正确
确定正常死亡率,是推算非正常死亡率的前提。如果正常死亡率定得高,非正常死亡率就会低; 将正常
死亡率定得低,非正常死亡率就会高。 所以运用回归模型估算“三年自然灾害 ”的非正常死亡人口数,必须
选定正常年份组成训练样本集合 。近年来,许多专家学者在研究“三年自然灾害 ”的非正常死亡人口数时,
[2][3]
之所以得到多种不同的结论, 其中一个重要原因就在于对正常年份的选定逻辑不同,由此得出的正常
[4]
死亡率自然也不会一样。 对于人口出生率和死亡率发生突然变化的时间段,用以后时期的正常状况作为
这一时间段非正常变化的标准,显然不合适。科学的方法应是选择发生突然变化之前的正常状况 ,作为比较
分析的训练样本集。
收稿日期: 2013 - 10 - 15
定稿日期: 2013 - 11 - 10
作者简介: 李闽榕( 1955 - ) ,男,山西安泽人,经济学博士,福建师范大学经济学院教授、博士生导师,主要从事宏观经济学研究; 万克峰( 1984
- ) ,男,吉林白山人,管理学博士,福建省新闻出版局,主要从事数量经济学研究。
83
2013 年第 12 期
图1 茅于轼《饥荒饿死人估算方法》中二次多项式回归趋势线
表1 1949—1970 年全国人口数量统计表
总人口 人口出生 人口死亡 人口自然 总人口 人口出生 人口死亡 人口自然
年份 年份
( 万人) 率( ‰) 率( ‰) 增长率( ‰) ( 万人) 率( ‰) 率( ‰) 增长率( ‰)
1949 54167 36. 00 20. 00 16. 00 1960 66207 20. 86 25. 43 - 4. 57
1950 55196 37. 00 18. 00 19. 00 1961 65859 18. 02 14. 24 3. 78
1951 56300 37. 80 17. 80 20. 00 1962 67295 37. 01 10. 02 26. 99
1952 57482 37. 00 17. 00 20. 00 1963 69172 43. 37 10. 04 33. 33
1953 58796 37. 00 14. 00 23. 00 1964 70499 39. 14 11. 50 27. 64
1954 60266 37. 97 13. 18 24. 79 1965 72538 37. 88 9. 50 28. 38
1955 61465 32. 60 12. 28 20. 32 1966 74542 35. 05 8. 83 26. 22
1956 62828 31. 90 11. 40 20. 50 1967 76368 33. 96 8. 43 25. 53
1957 64653 34. 03 10. 80 23. 23 1968 78534 35. 59 8. 21 27. 38
1958 65994 29. 22 11. 98 17. 24 1969 80671 34. 11 8. 03 26. 08
1959 67207 24. 78 14. 59 10. 19 1970 82992 33. 43 7. 60 25. 83
注: 表中数据根据茅于轼先生《饥荒饿死人估算方法》一文所提供数据计算
人口增长在正常情况下主要取决人口出生率 ,从一个较长时期看,人口出生会维持一个比较平衡的增长
率。根据表 1 数据计算,三年自然灾害之前的 1956—1958 年,平均人口出生率为 31. 72‰; 三年自然灾害的
1959—1961 年,平均人口出生率为 21. 22‰; 三年自然灾害之后的 1962—1964 年,平均人口出生率为 39.
84‰; 三年自然灾害加上前三年的六年间 ( 1959—1964 年) ,平均人口出生率为 30. 53‰; 三年自然灾害加上
前三年与后三年的九年中( 1956—1964 年 ) ,平均人口出生率为 30. 93‰。 通过以上比较可知,三年自然灾
害对中国人口增长的影响只是暂时的 ,没有影响人口的长远正常增长。 可见,茅于轼先生在《饥荒饿死人估
算方法》一文中,依据其运用二次曲线数学模型拟合估算出的 1959—1970 年间各年度应有全国总人口数,存
在着很大误差,这种误差主要是估算者的人为因素造成的 ,茅于轼先生将拟合误差全部算作死亡人口是不正
确的。
3. 不能将推算出的再出生人口数列为死亡人口
有的专家学者认为,茅于轼先生估算出的 1959—1970 年间各年度应有全国总人口数,确实与国家公布
的统计数据相差很大,但人是可以生育的,估算“三年自然灾害”以后的全国人口数量,必须考虑预期再出生
人口因素。因为从人口预测理论和实践看,推算分析一个时期人口变化,对未来人口增长趋势的影响,需要
考虑预期再出生人口因素。从这一角度讲,“三年自然灾害 ”期间的非正常死亡人口和少出生人口,都会对
[5]
全国未来人口增长产生负面影响 。 但是,还必须看到推算再出生人口因素对未来人口增长产生的影响是
有规律的,其与人的成长和生育周期密切相关 。非正常死亡人口中有生育能力的人 ,能够对近期的人口出生
率产生影响,少出生人口对人口增长产生影响则是代际的 ,即这部分人具有生育能力和生育责任后的人口出
生率。同时,人类在遇到自然和社会环境突变的影响使人口数量突然减少时 ,会在自然和社会环境恢复常态
后自发地提高出生率,这一机制会对预期再出生人口因素产生一定的弱化作用 。
基于以上原因,在估算“三年自然灾害 ”期间全国总人口实际应有多少时,不应将根据非正常死亡人口
和少出生人口推算的再出生人口归入非正常死亡人口 。
二、定量分析需用多种方法进行验证
我们使用三次曲线数学模型、平均增长率估算模型、二次指数平滑模型、非季节指数模型 4 种数学模型,
85
2013 年第 12 期
对“三年自然灾害”期间全国总人口进行拟合估算,并与茅于轼先生拟合估算的结果进行比较 。 无论从总体
还是关键年份看,茅于轼先生运用二次多项式回归模型拟合估算的全国总人口 ,
1958 年、
1961 年、
1962 年的
偏差率分别为 0. 11% 、 8. 36% 。使用三次曲线数学模型拟合估算的全国总人口 ,
7. 99% 、 1958 年、1961 年、
1962 年的偏差率分别为 0. 07% 、 7. 78% 。使用年均增长率估算模型拟合估算的全国总人口数 ,
7. 61% 、 1958
年、
1961 年、1962 年的偏差率分别为 0. 16% 、 6. 40% 。使用二次指数平滑模型拟合估算的全国总人
6. 53% 、
口,
1958 年、1961 年、 1962 年的偏差率分别为 0. 17% 、 6. 96% 、6. 87% 。 使用非季节指数模型拟合估算的全
国总人口, 1958 年、1961 年、 1962 年的偏差率分别为 0. 00% 、 7. 37% 、7. 41% 。
图2 拟合人口曲线趋势图
综合评价以上五种数学模型估算的全国总人口数与国家公布的统计数据的偏差度 ,可以看出年均增长
率数学模型拟合估算的人口数与国家公布人口统计数据的综合偏差度最小 ,为 14. 66% ; 二次指数平滑模型
拟合估算的综合偏差度较小,为 14. 90% ; 非季节指数平滑模型拟合估算的综合偏差度居中,为 16. 96% ; 三
次曲线数学模型拟合估算的综合偏差度较大 ,为 18. 71% ; 茅于轼先生使用的二次多项式拟合数学模型拟合
估算的综合偏差度最大,为 24. 23% ,比年均增长率数学模型的偏差度高出近 10 个百分点,表明其误差最
大,最不科学( 详见图 2) 。
三、“三年自然灾害”究竟饿死多少人?
“三年自然灾害”究竟饿死多少人? 要分析清楚这个问题,必须对平均正常死亡率、非正常死亡率、正常
死亡人口、非正常死亡人口、正常出生率、少生人口以及“三年自然灾害 ”期间全国总人口减少数量等几个关
[5]
键数据,进行测算。 同时,还必须使用多种数学模型来估算和验证“三年自然灾害”的死亡人口。
1. 平均正常死亡率和非正常死亡率
我们选择凝聚层次聚类的方法,分析“三年自然灾害 ”研究中“正常年份 ”选择问题。 首先,对 1949—
1970 年的数据进行定性分析。 选择 1949 ~ 1970 年的数据是为了保证“三年自然灾害”〔1959 ~ ^1961〕的前
序与后序时间等长,这对于分析人口波动的前期特征与后期特征通常是有效的。“三年自然灾害 ”期间的出
生率与死亡率与其余年份的差异较为明显 。
图 3 是 1949 ~ 1970 年年人口出生率与人口死亡率的波动曲线,由图可知,“三年自然灾害 ”期间,人口
出生率小于人口死亡率,人口出生率与人口死亡率的间隔是动态变化的 。通过定性分析人口指标的动态变
化特性,我们利用凝聚聚类的方法,对人口波动年份的类特征进行聚类分析 。凝聚聚类实验的结果说明,凝
86
“三年自然灾害”真的饿死 3000 多万人吗?
图 3 “出生率—死亡率—增长率”波动图
根据全序凝聚聚类的分析结果可知 : 1949 ~ 1954 年间的六年依次凝聚为一类; 1955 ~ 1958 年间的四年
凝聚为一类; 1959 ~ 1960 年的二年凝聚为一类。 表 3 显示了 1955 ~ 1958 年间的凝聚系数,1955 年与 1956
[6]
年的凝聚系数较小, 1956 年与 1957 年虽然凝聚为一类,但是凝聚系数相比于前者呈大幅增加 。 因此, 1949
~ 1958 年间,
1955 年与 1956 年的人口波动指标应该属于较为正常的年份。 需要特别指出的是, 1955 年在
二次凝聚时,与 1949 年具有较小的凝聚系数,相比于 1955 年, 1956 年的波动应该相对“正常”。
表3 1955 ~ 1958 年各类的凝聚系数
凝聚组合 系数
1955 年 ~ 1956 年 3. 155
1955 年 ~ 1957 年 19. 274
1955 年 ~ 1958 年 43. 963
率加总平均后,便可以计算出正常年份的平均正常死亡率 ,并推算出非正常死亡率:
87
2013 年第 12 期
3. 正常出生率和少生人口
从表 5 中的数据可以看出,“三年自然灾害 ”期间的非正常死亡人口数,与茅于轼先生计算得出的两年
就饿死 3634 万人的结果相差甚远。
与计算平均正常死亡率同理,对于一个人口出生率发生突然变化的时间段 ,用以后时期的正常状况作为
这一时间段的非正常变化的参照物是不合适的 ,需要选择发生突然变化之前的正常状况作为比较分析的参
照物。既然 1955 年与 1956 年在客观上是平均正常死亡率的正常年份,自然也应该是正常出生率的正常年
份。高非正常死亡率、高正常出生率的“双高”并存的年份,从理论和实践上看都不应该是“正常年份”。
基于以上认识,将选定的正常年份 1955 年与 1956 年的人口出生率加总平均后,便可以计算出正常年份
的平均正常出生率,进而推算出正常出生人口和少出生人口 ( 见表 6) :
平均正常出生率 = ( 32. 60‰ + 31. 90‰) /2 = 32. 25‰
正常出生人口数 = 当年正常出生率 × 当年人口
少出生人口数 = ( 正常出生率 - 当年出生率) × 当年人口
表 6 中的数据表明,“三年自然灾害”期间少出生人口合计 2193. 31 万人,大于茅于轼先生在《饥荒饿死
人估算方法》中计算得出 1959 和 1960 两年就少出生 1624 万人的结果。
表6 1949—1961 年正常出生人口和少出生人口
88
“三年自然灾害”真的饿死 3000 多万人吗?
4.“三年自然灾害”期间全国总人口减少数量
知道了“三年自然灾害”期间的非正常死亡人数和少出生人数 ,就可以计算出这一期间全国总人口减少
的数量:
“三年自然灾害”全国总人口减少( 万人) = 非正常死亡人数( 万人) + 少出生人数( 万人)
= 1242. 63 万人 + 2193. 31 万人 = 3435. 94 万人
“三年自然灾害 ”期间,全国非正常死亡 1242. 63 万人,少出生 2193. 31 万人,导致全国总人口减少
3435. 94 万人。这一计算结果与茅于轼先生在《饥荒饿死人估算方法》中计算得出 1959 和 1960 两年全国总
人口合计减少 5259 万人的结论相比,两者相差 1839. 65 万人,前者仅为后者的 65% 。
四、结 论
参考文献
责任编辑: 郑洪昌
89