论文部分内容阅读
大气能见度是海面重要的气象指标之一,对海洋资源开发、军事活动、航海以及海洋气象研究都具有很大的影响。目前国内外的海面能见度预测研究主要集中在单维度预测方面,其实验结果分析都比较片面。如果能够在有限的数据资料中通过机器学习的方法对海面能见度进行多维度的数据统计分析和预测,则能够对海面能见度的变化有一个更加全面的了解。因此基于这个需求本文进行了基于机器学习多维度的海面能见度研究,主要完成的工作和结论如下:(1)通过对BP(Back propagation)神经网络模型和LMS(Least mean aquare)的理论分析提出了LMS-BP(Least mean square-Back propagation)神经网络海面能见度时间维度预测模型,此预测模型解决了BP神经网络预测模型由于训练样本较大且相关性较高时出现的过拟合和欠拟合情况。通过对多维度的不同气象参数和污染物数据资料的数据统计分析进行训练建模,可以实现高准确率的海面能见度短时预测,比现有的神经网络模型在预测准确率上提高了10%。同时利用本文研究方法进行了不同海域陆地大气污染物PM2.5对海面能见度预测影响的实验,通过实验表明我国陆地的大气污染物PM2.5对海岸线海域和临海海域有一定的影响,对中海海域和远海海域影响较小。(2)提出改进的随机森林海面能见度空间插值算法。主要思想先利用高斯混合聚类模型对不同能见度等级的样本点进行聚类,然后再进行随机森林算法的空间插值预测,提高了随机森林空间插值算法在插值样本点分界面和能见度较低的情况下的空间插值精度。通过实验表明改进随机森林海面能见度空间插值算法比传统的空间插值算法在插值精度上均有提高,其中相比于随机森林空间插值算法在插值精度上提高了15%。通过对海面能见度不同季节、不同能见度等级以及不同天气情况下三个方面的海面能见度空间分布预测实验分析,表明海面能见度空间插值精度在四季中的冬季、一天时间里的中午、晴天以及能见度高于10km的时候较高。同时海面能见度在海岸线海域和临海海域空间分布预测随时间的变化较大,在空间分布上较密集。由此得出结论在海岸线海域和临海域较容易出现能见度差的情况,而中海海域和远海海域相比较少。