论文部分内容阅读
在陆地生态系统中,数据缺失是采用涡度相关技术监测通量数据时面临的普遍问题,如何准确地模拟陆地与大气间CO2通量数据交换量是当前全球气候变化研究的主要问题之一。使用机器学习技术持续探索通量数据模拟模型,更加精准地模拟结果,是提升数据集质量的前提和后续数据分析的基础。针对该问题,本文以北京奥林匹克城市森林公园的通量数据为研究对象,利用集成学习与神经网络技术对CO2通量进行分析与模拟,深入探究CO2通量的数据特征。论文主要研究成果可以概括为以下几个方面:(1)探究CO2通量数据的领域特征。本文采用XGBoost模型和基于梯度下降算法的神经网络模型对CO2通量数据的领域特征进行分析。结果表明,XGBoost模型能够对影响因子进行排序,基于梯度下降的人工神经网络可以有效地对环境因子进行特征响应分析。(2)探究CO2通量数据的时序性特征。分析CO2通量数据在不同尺度下(包括年尺度、季节性尺度、月平均日尺度)的变化情况及趋势并且计算自相关系数的平均值。结果表明,前3个时刻对于目标时刻的影响较为显著。(3)设计了基于特征融合的神经网络模型(ANN-LSTM),并与单特征模型模拟结果进行比较,包括反向传播神经网络,Moffat改进神经网络,基于单因子以及多因子的长短时记忆神经网络(Long short-term memory neural network,LSTM)。实验结果表明,本文所提出的ANN-LSTM集成模型在训练集上决定系数、均方根误差、平均绝对误差和一致性指数分别为0.792,3.012 μmol/(m2·s)、2.000 μmol(m2·s)和0.934,在测试集上决定系数为0.811,均方根误差为3.081 μmol/(m2·S),平均绝对误差为2.057μmol/(m2·s),一致性指数为0.937,相比于其他的模型,本方法的模拟精度最高。