基于数据挖掘的我国城市空气质量与城市发展的研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:yec
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要介绍了数据挖掘的聚类方法和分类方法基本理论,并比较了两者的区别。随后基于聚类和分类方法,使用系统聚类法中的最短距离法、最长距离法、Ward法和类平均法对实例进行聚类分析,并比较不同方法得到的聚类结果,最终选取合适的聚类结果;然后使用决策树分类方法中的递归分割树和C5.0算法对实例进行分类分析,并结合实际情况得到合理的分类决策树。首先以2015年我国30个主要城市(除拉萨市)的空气质量数据为研究对象,利用7个污染物相关指标,即二氧化硫、二氧化氮、可吸入颗粒物和细颗粒物的年平均浓度;烟尘排放量;一氧化碳日均值第95百分位浓度和臭氧日最大8小时第90百分位浓度这三类指标,通过数据挖掘方法和统计软件R语言,建立聚类模型,将30个城市聚为两类,空气质量较好的城市包括海口、昆明、南昌、南宁、贵阳、福州和兰州,其他城市为空气质量较差的城市。然后根据聚类结果,选取与空气质量相关的8个城市发展指标(机动车量、单位面积机动车量、万人机动车保有量、第二产业增加值、规模以上工业增加值、居民人均消费支出、人均GDP、绿化率)利用数据挖掘方法和统计软件R语言做决策树分类分析,提取了城市发展中对于城市空气质量较为显著的指标,得出了决策树的分类模型的具体规则。具体而言,通过决策树可以得到城市发展中影响空气质量的主要因素为规模以上工业排放污染物、机动车排放污染物和城市的绿化率,而人为因素对于城市空气的影响并不大。进一步的还可以得到城市的面积也成为空气污染控制的一大难题。最后根据本文的实证分析结果提出相应的建议,即将面积特大城市集中起来联合治理,多区域作战;通过改善汽车能源布局和加强公共交通系统的发展力度来减少车辆对于空气质量的消极影响;通过着重高新技术产业,稳定制造业类普通工业,减少重工业比例来改善工业结构;结合每个城市地区的特色制定不同的绿色城市政策导向,完善和监管评估系统。
其他文献
本文主要根据纸箱抗压强度的计算公式P=G×(n-1)×K,结合瓶盖纸箱实际使用过程中堆码层数、瓶盖重量、使用环境推断出瓶盖外包装箱所需的安全抗压强度。 This paper mainly
建立了一个具有升力体气动外形飞行器的运动方程,并把飞行器的推重比和其升阻比、发射角以及起飞加速度的函数关系建立了起来.利用这些关系分析的结论是:垂直起飞的推重比必
<正> 这次会议在江苏、广西召开,是因为这两个省区的内河航运建设走在了全国的前面,突出体现在苏南运河整治工程和西江桂平、贵港航运枢纽工程。苏南运河整治实施标准化,全线
研究目的:(1)探究TPD52基因在胶质瘤组织、正常脑组织及U87细胞中的表达水平;(2)探究干扰TPD52基因表达后对胶质瘤U87细胞增殖、周期及凋亡的影响;(3)探究干扰TPD52基因表达
自“休谟问题”提出以来,众多哲学大师各抒己见,各执一端,但终不能圆满解决。而实际上,怀疑主义大师休谟以不可知论的方式提出了一个连他自己也不能解答的“伪命题”。只有辩证唯
社会经济的发展,推动着我国当代教育改革进程的深入。高职教育作为我国高等教育领域当中的重要组成部分,在高等教育大众化的新形势下亦被赋予了越来越高的关注。同时,社会的
提升生鲜乳检测技术是保障乳品供应链品质的有效途径。本文以包含生鲜乳供应商、乳制品制造商以及需求市场三层决策主体的乳品供应链网络为研究对象,利用变分不等式理论构建乳
在宁夏中部干旱带的同心县采用统一设计多点布置方法研究荞麦机械化栽培技术,结果表明,荞麦机械化播种技术比常规露地人工种肥撒播种植平均增产259.4 kg/hm2。相对于人工种肥