论文部分内容阅读
为准确预测O3的质量浓度及其发展趋势,分析其诱发因素,提出一种基于集成学习的O3的质量浓度预测模型.以北京市2015-2016年O3污染物的质量浓度及气象因素数据为基础,提出并建立面向O3污染物的质量浓度预测的特征选择-集成学习多层预测模型,在对数据进行缺失值填补及异常值分析的基础上,利用Pearson相关分析和Lasso回归分析同时对清理后的气象资料数据进行特征选择,以消除数据冗余,提高预测精度;提出基于自组织映射神经网络(self-organizing featuremap,SOFM)和Elman神经网络(Elman neural network,ENN)的集成学习算法,利用SOFM对样本数据进行聚类以实现样本的合理分布后,使用ENN进行仿真训练来预测O3的质量浓度.试验结果表明:采用Pearson-Lasso特征选择和SOFM样本聚类对数据做前期处理后,ENN的预测精度由74.6%提高到82.1%,能够改善基于ENN的O3污染物的质量浓度的预测准确率.