基于数据挖掘的我国城市空气质量与城市发展的研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户：yec

【摘要】

：

本文主要介绍了数据挖掘的聚类方法和分类方法基本理论,并比较了两者的区别。随后基于聚类和分类方法,使用系统聚类法中的最短距离法、最长距离法、Ward法和类平均法对实例进

【作者】

：

黄燕

【出处】

：

华中师范大学

【发表日期】

：

2017年期

【关键词】

：

空气质量城市发展聚类分析决策树分类数据挖掘 R语言

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文主要介绍了数据挖掘的聚类方法和分类方法基本理论,并比较了两者的区别。随后基于聚类和分类方法,使用系统聚类法中的最短距离法、最长距离法、Ward法和类平均法对实例进行聚类分析,并比较不同方法得到的聚类结果,最终选取合适的聚类结果;然后使用决策树分类方法中的递归分割树和C5.0算法对实例进行分类分析,并结合实际情况得到合理的分类决策树。首先以2015年我国30个主要城市(除拉萨市)的空气质量数据为研究对象,利用7个污染物相关指标,即二氧化硫、二氧化氮、可吸入颗粒物和细颗粒物的年平均浓度;烟尘排放量;一氧化碳日均值第95百分位浓度和臭氧日最大8小时第90百分位浓度这三类指标,通过数据挖掘方法和统计软件R语言,建立聚类模型,将30个城市聚为两类,空气质量较好的城市包括海口、昆明、南昌、南宁、贵阳、福州和兰州,其他城市为空气质量较差的城市。然后根据聚类结果,选取与空气质量相关的8个城市发展指标(机动车量、单位面积机动车量、万人机动车保有量、第二产业增加值、规模以上工业增加值、居民人均消费支出、人均GDP、绿化率)利用数据挖掘方法和统计软件R语言做决策树分类分析,提取了城市发展中对于城市空气质量较为显著的指标,得出了决策树的分类模型的具体规则。具体而言,通过决策树可以得到城市发展中影响空气质量的主要因素为规模以上工业排放污染物、机动车排放污染物和城市的绿化率,而人为因素对于城市空气的影响并不大。进一步的还可以得到城市的面积也成为空气污染控制的一大难题。最后根据本文的实证分析结果提出相应的建议,即将面积特大城市集中起来联合治理,多区域作战;通过改善汽车能源布局和加强公共交通系统的发展力度来减少车辆对于空气质量的消极影响;通过着重高新技术产业,稳定制造业类普通工业,减少重工业比例来改善工业结构;结合每个城市地区的特色制定不同的绿色城市政策导向,完善和监管评估系统。

其他文献

如何建立啤酒瓶盖外包装纸箱的抗压强度标准

本文主要根据纸箱抗压强度的计算公式P=G×(n-1)×K,结合瓶盖纸箱实际使用过程中堆码层数、瓶盖重量、使用环境推断出瓶盖外包装箱所需的安全抗压强度。 This paper mainly

期刊

外包装箱抗压强度堆码层数安全系数总力值安全抗压强度

单级入轨运输器的发射技术研究

建立了一个具有升力体气动外形飞行器的运动方程,并把飞行器的推重比和其升阻比、发射角以及起飞加速度的函数关系建立了起来.利用这些关系分析的结论是:垂直起飞的推重比必

期刊

单级入轨飞行器发射技术火箭发动机

贯彻落实十五大精神开创我国内河航运建设新局面黄镇东部长在全国内河航运建设现场会上的讲话(摘要)

<正> 这次会议在江苏、广西召开,是因为这两个省区的内河航运建设走在了全国的前面,突出体现在苏南运河整治工程和西江桂平、贵港航运枢纽工程。苏南运河整治实施标准化,全线

期刊

内河航运碍航闸坝十五大精神

干扰TPD52基因表达对胶质瘤细胞的影响及miRNA-34a通过靶向TPD52调节胶质瘤U87细胞的周期变化

研究目的:(1)探究TPD52基因在胶质瘤组织、正常脑组织及U87细胞中的表达水平;(2)探究干扰TPD52基因表达后对胶质瘤U87细胞增殖、周期及凋亡的影响;(3)探究干扰TPD52基因表达

学位

胶质瘤miRNA-34aTPD52细胞凋亡细胞周期细胞侵袭细胞迁移

实践:“休谟问题”的终结之答

自“休谟问题”提出以来，众多哲学大师各抒己见，各执一端，但终不能圆满解决。而实际上，怀疑主义大师休谟以不可知论的方式提出了一个连他自己也不能解答的“伪命题”。只有辩证唯

期刊

“休谟问题”认识论实践

“电子技术”精品课程建设与开发实践

社会经济的发展,推动着我国当代教育改革进程的深入。高职教育作为我国高等教育领域当中的重要组成部分,在高等教育大众化的新形势下亦被赋予了越来越高的关注。同时,社会的

期刊

电子技术精品课程课程建设课程开发实践策略

考虑检测技术投入的乳品供应链网络均衡研究

提升生鲜乳检测技术是保障乳品供应链品质的有效途径。本文以包含生鲜乳供应商、乳制品制造商以及需求市场三层决策主体的乳品供应链网络为研究对象，利用变分不等式理论构建乳

期刊

乳品供应链检测技术投入变分不等式修正投影法

荞麦机械化栽培技术研究

在宁夏中部干旱带的同心县采用统一设计多点布置方法研究荞麦机械化栽培技术,结果表明,荞麦机械化播种技术比常规露地人工种肥撒播种植平均增产259.4 kg/hm2。相对于人工种肥

期刊

荞麦机械化栽培技术经济效益

基于数据挖掘的我国城市空气质量与城市发展的研究

其他学术论文