论文部分内容阅读
如今,数值天气预报已成为影响社会发展与日常生活的一种天气预报手段,而气象资料的同化技术有助于提高数值天气预报的准确性。由于地面气象观测资料存在问题,导致地面气象观测资料的利用率不高,因此对地面气象观测资料质量控制的研究为现在数值天气预报发展的首要任务之一。基于此,本文在考虑地面气温观测资料空间相关性及地面站分布特性的基础上,针对模型准确性、站点密集地区模型优化、新建或缺失值较多站点补充三个角度建立了一系列的地面气温空间质量控制方法,主要内容如下:运用莫兰指数与半变异函数分析气温的空间分布特性,为空间质量控制提供理论支持;采用Hubbard教授发明的人工随机误差方法模拟观测值,使用假设检验方法选择质量控制参数,为质量控制模型的评估提供支持;针对模型的准确性,应用人工鱼群算法对随机森林算法进行参数优化,提出一种基于改进随机森林的空间质量控制方法(ARF);针对站点密集地区优化模型时效性较差且准确性提升不明显的特点,应用空间回归检验方法筛选相关性较高的邻近站构成新的数据集,结合随机森林算法构建模型,提出一种基于空间回归检验-随机森林的空间质量控制方法(SRF);针对部分新建或有较长缺失值的站点,利用主成分分析算法将不同气象要素映射到同一坐标系下,结合随机森林算法构建模型,提出一种基于主成分分析-随机森林的空间质量控制方法(PCA-RF)。多组对比试验结果表明,基于改进或组合的随机森林算法的空间质量控制模型能够有效的应用于不同空间相关性和站点密度下的区域,同时能够对新建站或有较长缺失值的站点进行有效的质量控制。ARF方法适用于没有时效性要求的绝大部分站点,在不同地形及站点密度区域的普适性较强,相较于SRT与IDW方法具有更高的模型精确度,但是在站点密度较高区域精确度提升不明显且模型运行耗时较长;SRF方法适用于站点密度较高区域,其在不降低模型准确性的前提下能够有效降低模型的运行时间,但在站点稀疏区域优化效果不明显;PCA-RF方法适用站点有较长缺失值的情况,其在站点地面气温数据缺失的情况下,通过其它气象要素补充构建新的数据集,同时也能够提高数据的多样性,为数据缺失的站点做了补充。上述的三种空间质量控制方法基本满足我国绝大部分地面站质量控制要求,并可根据站点的需求和实际情况进行调整。