论文部分内容阅读
人口普查工作是一项重要的国情调查,国家政策的制定与实施会受人口普查数据的影响。如果人口普查数据质量不好,运用此数据进行各项分析的结果就不准确,将这种不准确结果作为制定政策的依据将影响中国社会的发展甚至是给整个社会的发展造成灾难性后果。因此,政府在制定各项政策措施之前,必须事先做好人口普查数据质量的分析工作。鉴于此,本文以我国第六次人口普查数据中的教育数据作为分析背景,从异常数据分析的角度剖析数据质量问题,旨在找出我国第六次人口普查数据教育数据中存在的异常现象,为教育部门制定教育规划、教育投入、教育政策等等提供一个切入点。本文从三个角度对我国第六次人口普查数据教育数据做异常分析:(1)从描述性角度,运用数据分析方法对我国31个省、直辖市以及自治区(除港澳台外)农村与城镇6岁以上各阶段受教育人口总体情况进行直观的全面的分析,找出此次人口普查数据中存在的异常现象,结合我国整体国情以及各地区情况进行说明;(2)从逻辑性角度,运用差额异常分析方法、同项异常分析方法和相关异常分析方法对我国31个地区农村与城市义务教育人口数据进行对比,找出我国第六次人口普查数据义务教育阶段数据中存在的异常现象,并结合该地区的实际情况进行说明;(3)从关联性的角度,根据描述性分析得出我国高等教育中存在异常现象,运用关联数据分析方法找出第六次人口普查数据高等教育数据中存在的异常并结合各地区实际情况进行说明。首先,对我国高等教育人口比率及其影响因素进行相关分析,找出高等教育人口比率的显著影响因素。其次,对已经选取出的显著因素做主成分分析,再利用得到的主成分做主成分线性回归,得到主成分回归方程。再次,一方面利用传统聚类分析方法和k-均值聚类分析方法对高等教育人口比率数据进行聚类分析,找出异常并结合各地区实际情况分析出现异常的原因;另一方面利用已经建立的线性回归方程,找出回归分析过程中的高杠杆点、拟合异常点以及强影响点,并结合各地区实际情况进行说明。最后,结合三种分析方法进行综合分析,找出我国高等教育数据中存在的异常现象并分析原因。