论文部分内容阅读
森林蓄积量是反映森林资源数量的重要指标,也是一项重要的林分调查因子。本文旨在探索不同的特征选择方法以及估测模型,以期为林业科学中蓄积量的估测研究提供新的方法与思路。本文率先将Boruta特征选择方法、极端梯度提升算法和Stacking集成学习算法应用于森林蓄积量估测研究。以浙江省龙泉市部分区域作为研究区域,结合高分二号数据、数字高程模型数据和森林资源二类调查数据,对森林蓄积量估测。主要结论如下:(1)从预处理后的高分二号遥感影像中分别获取了4个波段信息:蓝波段、绿波段、红波段和近红外波段,通过获取的波段信息进行植被指数的计算,得出归一化植被指数、比值植被指数、增强型植被指数、差值植被指数和土壤调节植被指数等5个植被指数;数字高程模型数据经过预处理后,从其中获取海拔、坡度和坡向等3个地形因子;再结合二类调查数据中的土层厚度、腐殖质厚度、年龄和郁闭度等4个实地调查因子组成原始特征集。(2)从特征数据集的角度来看,基于3种特征选择方法(相关性分析、逐步回归分析和Boruta特征选择)筛选后的特征集作为模型自变量因子集,其精度基本上都高于所有的因子参与估测。Boruta特征选择方法的效果优于其它两种方法。以决定系数、均方根误差、平均绝对误差、平均百分比误差和估测精度为评价指标,比较3种机器学习方法的估测结果,随机森林方法的效果最好,其次是极端梯度提升方法。(3)本文构建了初级学习器为极端梯度提升方法、随机森林方法和梯度提升方法,次级学习器为极端随机树方法的Stacking集成学习模型。结果显示,Stacking方法构建的蓄积量模型的估测结果均在82%以上,说明Stacking集成学习方法具有更强的泛化能力。同时,Stacking集成学习方法构建的森林蓄积量模型的估测精度均优于各种单一算法,表明Stacking集成学习算法对于改善森林资源蓄积量估测效果有重要的参考价值。