论文部分内容阅读
随着我国城市化进程的快速推进,城市人口、交通规模、能源消耗也在不断扩大,导致可吸入颗粒物、一氧化碳,二氧化硫、氮氧化物等空气污染物大量增加,造成严重的空气污染问题。雾霾、PM2.5浓度超标就是一个明显的特征。空气污染严重破坏生态环境,不仅对人们的日常生活、身心健康产生影响,而且对城市的投资环境、吸引人才、社会文化、经济发展等许多方面都有巨大的影响。减少空气污染对于城市的可持续发展有着重大的意义,已成为各国政府亟待解决的问题,并且引起大机构、大企业的关注,因而也成为研究人员、学者研究的热点。面对上述挑战,本文在前人研究的基础上,提出了一个改进型的基于时空混合模型的城市空气质量预测方法。具体研究内容如下:1.研究目标城市空气质量与该城市空气污染物及天气情况之间的时序依赖关系,并采用多元线性回归方法建立基于气象数据及空气质量历史数据时序相关性的空气质量预测模型。其中,空气污染物包括目标城市空气质量监测站点收集到的空气污染物浓度等数据,天气情况包括目标城市气象站记录的气象数据和天气预报等数据;2.研究目标城市周边环境对该城市空气质量的影响,即研究周边城市的空气污染物和天气情况与目标城市空气质量之间的空间相关性,并采用人工神经网络方法建立基于气象数据及空气质量历史数据空间相关性空气质量预测模型。其中,空气污染物数据包括周边城市空气质量监测站点收集到的空气污染物浓度等数据,气象数据包括周边城市气象站记录的气象数据和天气预报数据;3.采用基于历年空气质量月平均值及分段平均值的聚合方法整合前述两种独立空气质量预测结果,形成最终的时空混合空气质量预测模型;4.最后用北京市和深圳市的空气质量数据和气象数据来验证本文提出的模型。实验结果表明,本文提出的模型在空气质量预测准确率方面比前人的方法有较好的改善。本文有3个创新点:1.在建立基于时序空间关系的空气质量预测模型中,本文从一个新的视角考虑更大范围、更远久的空气质量历史数据之间的相关性。具体地说,本文提出空气污染物浓度分段平均值的概念,并把污染物浓度月平均值和分段平均值作为一个相关因素加到多元回归模型中。现有的基于时序空气质量预测方法中所用的数据通常是局部的(用过去几小时的数据预测未来空气质量),而本文提出的方法利用了过去一个月内一段时间的数据(分段平均值)和过去几年月平均数据,在预测过程中除了考虑空气质量变化的局部因素,还考虑了空气变化的中长期变化趋势。因此这种方法更有利于提高空气质量的预测准确率。2.在建立基于空间关系的空气质量预测模型中,本文考虑了在一个较大的区域内多传感器(空气质量监测站)数据在时空上不同步的因素,先解决不同步数据的时间对准问题,然后再训练模型。数据不同步对模型预测准确性有很大影响,一个明显的问题是,远离目标城市的空气污染在t时刻的数据不可能影响到目标城市t+1时刻(即t后延一小时的时间)的空气质量。例如,张家口离北京250km,如果吹4级西北风,风速为每小时25km,那么张家口的污染物经过10小时会到达北京。因此,在预测某时刻t北京空气质量时,可把张家口t-10时刻的污染物浓度看作是与北京空气质量相关的数据。换句话说,把有一定时间提前量的数据作为神经网络预测模型的输入,更能反空气映污染物的空间相关性。3.本文提出一个新的模型聚合方法,把基于时序多元回归预测模型结果、基于人工神经网络预测模型结果、历年空气质量月平均值及分段平均值聚合成一个新的预测结果,形成最终的时空混合空气质量预测模型。本文的贡献在于:1.在构建基于时序多元线性回归的预测模型中,扩展了历史数据的应用范围。原有方法“用过去几小时数据预测未来空气质量”,本文提出的分段平均值数据是从月初到当前时间的平均数据(监测站每小时报一次读数),月平均值是过去几年的月平均值数据。2.在建立基于空间关系的空气质量预测模型中,本文找到了一组具有更好空间相关性的数据作为神经网络模型的输入。即考虑了在一个较大的区域内多传感器(空气质量监测站)数据在时空上不同步的因素,先解决不同步数据的时间对准问题,然后再训练模型。3.提出一个新的模型聚合方法。原有的聚合方法是根据不同条件选择不同训练模型来做预测,本文的方法是把基于时序多元回归预测模型结果、基于人工神经网络预测模型结果、历年空气质量月平均值及分段平均值聚合成一个新的预测结果,形成最终的时空混合空气质量预测模型。这些都是本文的创新工作。