基于人口普查数据质量的异常数据分析

来源 :成都理工大学 | 被引量 : 4次 | 上传用户:falconlingzi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人口普查工作是一项重要的国情调查,国家政策的制定与实施会受人口普查数据的影响。如果人口普查数据质量不好,运用此数据进行各项分析的结果就不准确,将这种不准确结果作为制定政策的依据将影响中国社会的发展甚至是给整个社会的发展造成灾难性后果。因此,政府在制定各项政策措施之前,必须事先做好人口普查数据质量的分析工作。鉴于此,本文以我国第六次人口普查数据中的教育数据作为分析背景,从异常数据分析的角度剖析数据质量问题,旨在找出我国第六次人口普查数据教育数据中存在的异常现象,为教育部门制定教育规划、教育投入、教育政策等等提供一个切入点。本文从三个角度对我国第六次人口普查数据教育数据做异常分析:(1)从描述性角度,运用数据分析方法对我国31个省、直辖市以及自治区(除港澳台外)农村与城镇6岁以上各阶段受教育人口总体情况进行直观的全面的分析,找出此次人口普查数据中存在的异常现象,结合我国整体国情以及各地区情况进行说明;(2)从逻辑性角度,运用差额异常分析方法、同项异常分析方法和相关异常分析方法对我国31个地区农村与城市义务教育人口数据进行对比,找出我国第六次人口普查数据义务教育阶段数据中存在的异常现象,并结合该地区的实际情况进行说明;(3)从关联性的角度,根据描述性分析得出我国高等教育中存在异常现象,运用关联数据分析方法找出第六次人口普查数据高等教育数据中存在的异常并结合各地区实际情况进行说明。首先,对我国高等教育人口比率及其影响因素进行相关分析,找出高等教育人口比率的显著影响因素。其次,对已经选取出的显著因素做主成分分析,再利用得到的主成分做主成分线性回归,得到主成分回归方程。再次,一方面利用传统聚类分析方法和k-均值聚类分析方法对高等教育人口比率数据进行聚类分析,找出异常并结合各地区实际情况分析出现异常的原因;另一方面利用已经建立的线性回归方程,找出回归分析过程中的高杠杆点、拟合异常点以及强影响点,并结合各地区实际情况进行说明。最后,结合三种分析方法进行综合分析,找出我国高等教育数据中存在的异常现象并分析原因。
其他文献
<正>在中专院校的教师队伍中,女教职工是不可或缺的重要组成部分,她们自身素质的特殊性决定了对其进行素质培养工作的特殊性。提高中专院校女教工的素质,不仅有利于中专院校
证明责任在刑事非法证据中占据着重要的地位。证明责任在控辩双方之间如何分配,其证明标准应达到何种程度,对于刑事非法证据排除规则的有效实施起着至关重要的作用。然而,我国在
【摘要】目的:探究HSD智能麻醉药品管理柜在药品管理工作中的使用效果。方法:对我院两个院区麻醉药品的管理情况进行分析,对第一院区采用HSD智能麻醉药品管理柜对药品进行管理,对第二院区采用传统的人工管理模式对药品进行管理,比较两组麻醉药品的管理和使用情况。结果:第一院区记录入次、实际人次、处方数和修改处方数均多于第二院区,差异显著,有统计学意义(P<0.05),第一院区的登记遗漏率、修改率和核对耗时
对32例P ilon骨折患者采用锁定钢板手术治疗并进行效果评估分析。平均观察18个月,骨折均愈合。锁定钢板治疗P ilon骨折具有固定牢靠、骨折愈合率高、功能恢复好之优点。
目的探讨应用锁定加压接骨板联合同种异体骨治疗桡骨远端C型骨折的临床疗效。方法2003年1月~2008年4月收治桡骨远端C型骨折22例,年龄28~73岁,平均58岁。按AO分型:C1型12例,C2型6例,C
目的:研究全身麻醉俯卧位下脊柱手术病人眼部护理中眼膏的应用效果。方法:选取本院2016年1月至2018年11月收治的84例脊柱手术患者,全部患者均经全身麻醉取俯卧位下行手术治疗
目的探讨支气管动脉CT血管造影(CTA)在肺部大咯血介入栓塞治疗中的应用。方法选取本院收治的大咯血拟行介入栓塞治疗患者23例作为研究对象,术前均给予支气管动脉CTA检查,明确
<正> 患者男性,32岁,1992年10月19日坠入电镀槽中,左下肢被铬酸酐灼伤,面积15%。现场自来水冲洗20分钟,在厂医院用弱碱性溶液冲洗5分钟。病人出现头晕、恶心、深黄色尿,创面剧