基于特征选择和Stacking集成学习算法的森林蓄积量估测研究

来源 :浙江农林大学 | 被引量 : 4次 | 上传用户:xyjslzy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
森林蓄积量是反映森林资源数量的重要指标,也是一项重要的林分调查因子。本文旨在探索不同的特征选择方法以及估测模型,以期为林业科学中蓄积量的估测研究提供新的方法与思路。本文率先将Boruta特征选择方法、极端梯度提升算法和Stacking集成学习算法应用于森林蓄积量估测研究。以浙江省龙泉市部分区域作为研究区域,结合高分二号数据、数字高程模型数据和森林资源二类调查数据,对森林蓄积量估测。主要结论如下:(1)从预处理后的高分二号遥感影像中分别获取了4个波段信息:蓝波段、绿波段、红波段和近红外波段,通过获取的波段信息进行植被指数的计算,得出归一化植被指数、比值植被指数、增强型植被指数、差值植被指数和土壤调节植被指数等5个植被指数;数字高程模型数据经过预处理后,从其中获取海拔、坡度和坡向等3个地形因子;再结合二类调查数据中的土层厚度、腐殖质厚度、年龄和郁闭度等4个实地调查因子组成原始特征集。(2)从特征数据集的角度来看,基于3种特征选择方法(相关性分析、逐步回归分析和Boruta特征选择)筛选后的特征集作为模型自变量因子集,其精度基本上都高于所有的因子参与估测。Boruta特征选择方法的效果优于其它两种方法。以决定系数、均方根误差、平均绝对误差、平均百分比误差和估测精度为评价指标,比较3种机器学习方法的估测结果,随机森林方法的效果最好,其次是极端梯度提升方法。(3)本文构建了初级学习器为极端梯度提升方法、随机森林方法和梯度提升方法,次级学习器为极端随机树方法的Stacking集成学习模型。结果显示,Stacking方法构建的蓄积量模型的估测结果均在82%以上,说明Stacking集成学习方法具有更强的泛化能力。同时,Stacking集成学习方法构建的森林蓄积量模型的估测精度均优于各种单一算法,表明Stacking集成学习算法对于改善森林资源蓄积量估测效果有重要的参考价值。
其他文献
数值模拟是研究高速远程滑坡的重要手段。本文以茂县新磨村滑坡为例,提出一种三维大规模滑坡离散元建模与数值模拟方法。基于离散元法宏微观转换公式和数值模拟测试,快速得到
校因文化具有全方位的德育功能,在受教育者培养良好品德和健康成长的过程中发挥着巨大的作用,学校应予以高度重视.
本文回顾性分析于我院接受根治性放疗的186例宫颈癌患者临床资料,探讨影响宫颈癌放疗疗效的相关因素。1资料与方法1.1一般资料选取2008年1月-2011年12月我院收治的186例宫颈
“三基”建设是一项牵涉到公安工作根基的综合性系统工程,需要各级组织和全体民警积极投入。结合厦门铁路公安处新建处的特点,提出了围绕“当好领导、精简机关、夯实基层”的全
倪兴亮的自传体长篇小说<远方的爱>的真正意义,不在小说创作的艺术上,而在于它为我们打开了一个生存的阶层.这个阶层虽然生活得很平凡、很无奈,但也有他们无法剥夺的生活空间