论文部分内容阅读
滑坡是目前主要的自然灾害之一,利用遥感技术进行滑坡灾害分析已成为滑坡应急救灾和灾后评估的有效手段。在遥感滑坡灾害应用中,往往面对的是数据量巨大的高分遥感影像,传统的基于目视解译和面向对象影像分析存在局限性。针对高分辨率遥感影像滑坡识别与分类的实际需求,同时顾及样本纹理、形状等特征信息和样本间的空关系。本文综合随机森林(Random Forest,RF)算法和委员会投票选择(Query-By-Committee,QBC)算法,提出了一种新的样本查询算法RF-QBC(Random Forest of Query-by-Committee),并搭建了一种面向高分辨率遥感影像的滑坡自动提取新的技术方法,通过影像分割、特征提取、样本查询等步骤完成滑坡灾害信息自动化提取。其整体设计的思路是面向对象分析框架下的一系列机器学习算法集合,核心内容是在影像分割后结合RF-RFE(Random Forest of Recursive Feature Elimination)特征选择算法和RF-QBC算法来构建样本自动选择策略。首先,基于面向对象分割方法对遥感影像及GIS等相关辅助数据进行分割,将分割结果作为分类对象;利用RF-RFE算法筛选分割结果的光谱、纹理等地物特征,作为样本查询的依据。继而利用RF-QBC算法构建样本查询策略,迭代计算样本的投票熵。最后,将所有标记样本作为最终的分类样本;用该组分类样本执行随机森林分类,实现山体滑坡的精确提取。论文完成的主要工作如下:(1)构建一个滑坡信息自动化提取流程。集成RF-RFE特征选择法、RF-QBC委员会投票选择法,以及随机森林算法,构建一种基于机器学习法滑坡灾害信息的自动化提取流程。实验表明,本文提出的提取流程在滑坡空间识别和总体定位方面具有一定优越性,与目视解译分类结果进行比较,该方法的提取效果可满足实际的滑坡灾害应用需求,并具有较高客观性。(2)影像分割后特征参数的选择。利用RF-RFE算法筛选影像分割后的光谱、纹理、形状等地物特征参数,选择最优特征子集,并对最优特征子集的特征重要性进行排序。采用RF-RFE算法可以有效地剔除特征子群的同时提升了分类器的分类性能。实验结果显示,特征数目的增加对提高影像对象信息量的效果不明显,RF-RFE所选取的最终特征子集能比较真实地反映实验区地物类型特征。(3)建立滑坡自动化采样策略。利用RF-QBC主动学习方法,对特征筛选后的无标注分割对象建立样本自动选择策略,选择迭代过程中最大信息熵的对象作为最终分类样本。RF-QBC算法的滑坡采样结果,在用户准确度、F-Measure精度等遥感影像采样评价指标和机器学习分类模型评价指标中都有较好表现,优于原有的Boosting-QBC算法。(4)利用自动化采样得到的分类样本训练随机森林分类器,实现滑坡精确提取。实验结果得出实验区域RF-QBC方法在高分遥感影像滑坡采样上优于Boosting-QBC算法,RF-QBC滑坡采样的随机森林分类精度比Boosting-QBC的结果提高了约11%。在整体实验区域内,RF-QBC滑坡分类结果在提高定位精度的同时,保证了滑坡提取结果的空间一致性,特别是在在山谷、河道以及滑坡分布破碎区域。RF-QBC方法预测滑坡的分类结果,与野外验证点建立的解译标志基本一致,其提取结果可满足实际的滑坡灾害应用需求。与目视解译相比,本文的提取流程具有较高的客观性。