人口普查中存在的漏报情况评估分析
来源:用户上传
作者:
[摘要]采用年龄移算法分别利用贵州省第六次普查的数据和《2005年贵州省1%人口抽样调查资料》对2000年贵州省第五次普查的人口进行漏报估计及回填,通过两种方法进行对比,贵州省“五普”数据均存在漏报情况,而且在0~9岁年龄段表现尤其明显。但是总人口的漏报率却差异较大,用“六普”数据估算的漏报率为1.55%,而用《2005年贵州省1%人口抽样调查资料》估算的漏报率达8.64%。漏报情况在性别差异上,两种估计结果一致,女性漏报情况与男性相比较为明显。
[关键词]人口普查;人口漏报;年龄移算法;线性插值;人口统计
[中图分类号]C921.2 [文献标识码]A
1 引言
到目前为止,我国进行了六次人口普查和三次人口1%的抽样调查,基于对人口普查数据质量的质疑,对人口普查数据质量进行检验是十分必要的。利用两次普查的数据来检验前一次普查数据的质量,是评价普查数据质量的一个重要方法。由于近年来,我国人口普查十年为一个周期,故也可以利用这十年中的人口1%抽样调查资料对人口的漏报情况进行估计。本文就是在这两种数据基础上,对贵州省第五次人口普查(以下简称“五普”)存在的漏报情况进行估计和评价。
“五普”数据显示:截至2000年11月1日零时,贵州省总人口为35247695人,男性人口占52.38%,女性人口占47. 62 %,性别比(以女性为100,男性对女性的比例)为110.02∶100,略高于106~108此正常比例范围 ,同时也高于全国106.74的平均水平。
2 用贵州省“六普”数据来检验 “五普”人口漏报率的情况分析
2010年贵州省第六次人口普查(以下简称“六普”)数据显示:截至2010年11月1日零时,全省常住人口为34746468人,其中,男性人口为17951451人,占51.66%;女性人口为16795017人,占48.34%。2010年总人口性别比由2000年第五次人口普查的110.02下降为106.89。
2.1 方法与模型
本次对人口漏报检验的方法主要来自于田雪原等提出的多区域离散人口发展模型中对人口普查数据的回填方法及处理方式,并且本文未考虑现役军人的情况,利用2010“六普”数据对2000年的“五普”结果进行漏报分析,以检验“五普”数据的质量。
采用的公式如下:
公式中的符号分别表示:
Pm(2000,x)、Pf(2000,x):2000年x岁男性、女性人口数
EPm(2000,x)、EPf(2000,x):倒推回去的2000年x岁男性、女性人口数
△Pm(2000,x)、△Pf(2000,x):估计得到的 “五普”人口中x岁男性、女性的误报量。
当△值为正时,表示不能确定2000年该年龄是否存在漏报;而当△值为负时,确定该年龄存在漏报。
2.2 所需数据的处理
由于“五普”和“六普”数据反映的时点一致,故可以直接用于比较计算。将贵州省“五普”和“六普”中分性别、分年龄的人口死亡率进行线性插值,分别计算从2000年到2010年各年间分性别、分年龄的死亡率。
利用上述公式计算回填后贵州省2000年分性别、分年龄的人口数,与2000年普查数据进行对比,计算分性别、分年龄的漏报量和漏报率。
2.3 用“六普”数据估计得到的2000年分性别、各年龄段人口的漏报情况
估计的“五普”数据中,人口总的漏报量为54.6万人,其中男性漏报24.6万人,女性漏报30.0万人。从各个年龄组来看,0~4岁、30~49岁、50岁以上三个年龄组的男性、女性误报量均为负数,确定这三个组均存在漏报,其中0~4岁年龄组是漏报现象最严重的组别,漏报规模最小的是30~49岁年龄组。在5~9岁、10~17岁年龄组误报量的估计值为正,不能确定是否存在漏报。而18~29岁年龄组中只能确定女性漏报规模较大。从漏报量在性别上的分布来看,女性的漏报情况较为突出,在漏报现象最严重的0~4岁年龄组,女性漏报量为23.3万人,比男性多2.7万人。估计得到的总人口漏报率为 1.55%。
3 利用《2005年贵州省1%人口抽样调查资料》估计2000年“五普”人口漏报情况
《2005年贵州省1%人口抽样调查资料》的数据显示,此次调查的总人口为44.2万人,男性22.8万人,女性21.4万人。男女性别比为106.2。在此次抽样过程中,样本容量达到69万人,占全省总人口的1.85%。对2000年人口数据的估计,具体步骤如下。
3.1 方法与模型
此方法是在上述模型和方法的基础上,根据2005年的1%普查数据,进行改进的结果。同样可以去估计“五普”数据的质量。采用的计算方法如下:
同样地,当△值为正时,表示不能确定2000年该年龄是否存在漏报;而当△值为负时,确定该年龄存在漏报。
3.2 所需要数据处理
3.2.1 2005年抽样调查得到的人口为44.2万人,占2005年贵州省总人口的比例为1.19%。按照这样的比例,将各年龄的人口分别进行回填。
3.2.2 采用线性插值法估计2000~2005年之间各年龄死亡概率。公式如下:
0岁人口死亡概率,其中r取经验值0.25。
其他年龄组死亡概率
其中,mx表示x岁人口的死亡率。
2001~2004年各年龄别死亡概率的计算,是根据2000年和2005年死亡概率,采用线性插值法得到。
3.3 2000年按年龄分组的漏报情况
利用2005年贵州省1%人口抽样调查资料》估计得到的2000年“五普”人口漏报结果显示,总人口的漏报量为304.6万人,其中男性漏报144.7万人,女性漏报159.9万人。 从各个年龄组来看, 0~9岁、30~49岁和50岁以上年龄组的漏报规模都较大,最为严重的是0~9岁年龄组;10~17岁年龄组误报量为正,不能由此确定是否存在漏报;18~29岁组女性存在漏报。从性别上来看,女性漏报情况较男性突出,但在各个年龄组表现不同。漏报情况最严重的0~9岁年龄组,男性漏报64.6万人多于女性4.8万人,占0~9岁原始人口的15.27%;而30~49岁年龄段女性漏报多于男性19万人。总人口漏报率为8.64%。
4 两种估计结果对贵州省“五普”漏报情况分析
两种估计结果显示,贵州省“五普”数据均存在漏报情况,而且在0~9岁年龄段表现尤其明显。但是总人口的漏报率却差异较大,用“六普”数据估算的漏报率为1.55%,而用《2005年贵州省1%人口抽样调查资料》估算的漏报率达8.64%。漏报情况在性别差异上,两种估计结果一致,女性漏报情况较突出。
用“六普”数据估算的漏报率为何远低于《2005年贵州省1%人口抽样调查资料》估算结果?分析其中原因,本文认为与如下因素有关。
与抽样调查这一统计调查的组织方式有关。人口的1%抽样调查采用分层、多阶段、整群、概率比例多种抽样方法进行,所以会和普查的结果存在一定的差异。
在用1%人口抽样数据去估计2005年各年龄组分性别的人口数时,各年龄人口是按相同的比例1.19%进行的回填,即各年龄人口数均匀分布的假设不是很合理。
第六次人口普查数据的质量尚未进行检验。如果用一个质量不好的数据去检测另一个数据,其准确性也会受到一定的质疑。
总之,贵州省第五次人口普查的数据存在一定程度的漏报情况,而且漏报现象在低年龄组的表现较为明显,从性别来看,男性和女性的漏报情况也存在一定的差异。
[参考文献]
[1] 田雪原,等.21世纪中国人口发展战略研究[M].北京:社会科学文献出版社,2007.
[2] 曾毅等.21世纪中国人口与经济发展[M].北京:社会科学文献出版社,2006.
[3] 温勇、尹勤.人口统计学[M].江苏:东南大学出版社,2006.
[4] 贵州省统计局.贵州省2010年人口普查资料[M].北京:中国统计出版社,2012.
[5] 贵州省统计局.贵州省2000年人口普查资料[M].北京:中国统计出版社,2002.
[6] 貴州省统计局.2005年贵州省1%人口抽样调查资料[M].北京:中国统计出版社,2007.
[7] 朱淑娟. 贵州省劳动力供求状况分析及预测[D].贵阳:贵州财经大学,2011.
转载注明来源:https://www.xzbu.com/1/view-14946157.htm