基于随机森林算法对内蒙古地区地面逐日平均温度的估算

被引量 : 0次 | 上传用户:zfx523
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
进行地面观测是气象台站最重要和最基本的工作之一,准确的台站气象观测数据是实现天气预报和气候分析的数据基础,同时也为数值预报模式提供可靠的数据来源。但是一些一般站由于传感器等元件受到环境的干扰,甚至损坏,导致观测出现误差,造成损失。有些台站的数据虽然非常重要,但对于非气象局的单位,比如企业却难以获取,难以利用这些数据产生实际的经济价值,因此如何准确估算出这些台站的观测数据减少损失并使其能够为企业服务则成为有意义的问题。如今在大数据时代,众多机器学习的算法被应用在金融等领域预测风险,气象数据来源众多,但各个数据集精确度不一样,分辨率也不同,如何利用大数据挖掘技术将这些来源众多的气象大数据充分利用,使其融合成一套准确度更高的数据集用来补充地面气象观测站的观测数据是值得考虑的。利用欧洲中期天气预报中心的逐日地面观测资料(ERA-Interim)、CFSR等再分析资料以及台站高度、坡度等地形数据,将这些资料结合在一起,使用随机森林算法对内蒙古地区2014年至2016年地面逐日平均温度进行了估算,同时建立多元线性回归方程和多元非线性回归方程,使用平均相关系数、平均相对误差等统计量对以上不同估算方法的结果进行了比较。结果显示,在内蒙古的23个国际标准站上的估算结果显示,使用随机森林估算的逐日平均温度的平均绝对误差为1.098K,经过插值后的ERA-Interim和CFSR再分析资料平均绝对误差分别为1.504K和1.625K;同时使用线性回归方程和非线性回归方程对内蒙古地区逐日平均温度所有台站的平均绝对误差分别为1.317K和1.204K,经过比较,随机森林算法能够利用不同来源的地面逐日平均温度资料降低误差,形成一套准确度更高的地面逐日温度资料,并且在误差上也低于使用线性方程和非线性方程估算的结果。但是计算效率分析表明,随机森林的计算效率低于以上两种方程,因此提高随机森林的计算效率将有助于完善随机森林算法。研究通过在内蒙古地区的研究初步验证了随机森林在估算地面逐日平均温度的可行性,并有望通过这种方法融合出一套更准确的观测资料使其能在台站观测数据出现中断或难以获得台站观测资料时补充观测结果。
其他文献
在与传统能源系统方案比较基础上,提出冷热电联供(BC唧)系统经济性的增量评价法,从而避免了热价、冷价等人为因素干扰,使BCHP系统经济性的评价更加客观,并针对大学的BCHP系统进行经
通过沉降炉燃煤实验,讨论了燃煤过程中亚微米颗粒的形成机理,研究了炉膛温度、煤粉粒径及氧浓度对亚微米颗粒生成的影响。实验选择平顶山烟煤、六盘水烟煤和合山烟煤,每种煤
为掌握住宅土地市场价格变动状况,本文基于住宅地价指数,运用对比分析与主成分分析,从宏观角度研究2000-2015年杭州市住宅地价动态变化及其影响因素。通过研究发现2000年来杭
目的:探讨中西医结合治疗腰椎间盘突出症的临床疗效。方法:以传统中医的推拿按摩结合中西医药物治疗。结果:优良率为85%;有效率80%;无无效患者。结论:中西医结合治疗腰椎间盘突出
现今,人们的生活水平有了大幅提高,对于电力资源的使用需求也在不断增加,同时,电力基础设施建设也需要满足电力发展的基本要求,从而更好的保证人们能够正常的工作生活。在110
<正>小儿急性感染性喉炎为喉部粘膜急性弥漫性炎症,大都为上呼吸道感染的一部分。有时可在麻疹或其它急性传染病的病程并发,由于小儿喉腔狭小,粘膜血管丰富等解剖特点。因此
会议