论文部分内容阅读
遥感图像场景理解与信息提取作为遥感图像解译的最终目标,是遥感图像处理领域的一项系统工程,有着广阔的应用前景和重要的民用和军事价值。遥感图像往往幅面很大,背景比较复杂,包含很多具有姿态、大小、方向多样性的地物目标,而且场景类别繁多,有的类别彼此之间差异很小、非常容易混淆,这些因素都给遥感图像场景理解与信息提取造成极大的困难。所以,遥感图像场景理解与信息提取是一项具有实际意义和挑战性的研究课题。本论文以高分辨率光学遥感图像为研究对象,对遥感图像场景理解的分支任务遥感图像目标检测、场景分类以及语义标注等关键技术进行了研究,针对现有方法存在的一些缺点,提出了四种新的方法。本论文的研究属于遥感图像处理领域的研究重点,具有很强的理论意义和实际应用价值。本文的主要工作和贡献总结如下:1.为了有效解决巨幅遥感图像中的目标检测问题,提出了一种基于视觉显著性和条件随机场的层进式遥感图像目标检测方法,该方法分为粗略检测和精细检测两个层进步骤。在粗略检测时,设计了一种基于目标导向的视觉显著性方法来快速提取大幅面遥感图像中的目标感兴趣区域。这样一方面可以缩小目标的检测范围、降低虚警率,另一方面可以大大降低目标检测系统的运行时间、提高检测效率。紧接着,在提取出的感兴趣区域中进行基于多尺度随机场模型的精细检测,在感兴趣区域的每一个尺度中,利用稀疏编码对目标进行表征,并利用条件随机场模型对组成目标的各个部件之间以及目标与周围区域之间的上下文信息进行建模,以增加检测的鲁棒性。最后综合多个尺度下的目标检测信息得到最终的检测结果。实验结果表明了该方法的有效性和鲁棒性。2.为了有效解决遥感图像由成像视角(从上到下成像)造成的旋转问题以及底层特征在表征遥感图像内容时的“语义鸿沟”问题,提出了一种旋转不变多特征概率潜在语义分析模型,并将该模型用于遥感图像目标检测和场景分类。首先,提取并量化遥感图像的不同底层视觉特征,用来得到不同的视觉单词和视觉词典,然后对不同视觉单词的条件分布使用同一潜在语义主题进行约束,即从不同的视觉单词中挖掘学习出同一潜在语义主题,这样将充分利用不同特征之间的互补性,同时在学习的过程中约束同一图像的不同旋转方向的潜在语义尽可能地一致,这样学习出来的潜在语义主题将能有效地对抗遥感图像中的旋转情况。遥感图像目标检测和场景分类实验结果均表明了本方法的有效性。3.为了从遥感图像中学习到具有判别性的高层语义特征用于场景分类,提出了一种基于堆叠判别式稀疏自编码的遥感图像场景分类方法,该方法首先设计了一种判别式稀疏自编码网络模型,采用成对约束这种相比于类别信息更加简练有效的监督信息作为自编码特征学习时的判别约束,使得同一类别的不相似样本在学习到的新特征空间中距离尽可能地近,而不同类别的易混淆样本在新特征空间中距离尽可能地远,进而保证学习出来的特征的判别力。然后以判别式稀疏自编码为基本单元堆叠起来构成堆叠判别式稀疏自编码深度神经网络,来学习具有判别能力的更高层语义特征,并在堆叠判别式稀疏自编码深度神经网络的顶层搭建Softmax分类层用于场景分类。在LULC数据集上进行了遥感图像场景分类实验,实验结果表明了本方法的有效性和鲁棒性。4.为了能够在有限的训练样本情况下以最小的人工代价达到较佳的遥感图像语义标注性能,提出了一种基于高层语义特征迁移的弱监督遥感图像语义标注方法,该方法采用高层语义特征迁移的方案对遥感图像进行表征,而不是从现有训练数据中学习高层语义特征进行表征,有效减少了算法本身对训练数据的需求量同时又保证了对遥感图像进行表征的鲁棒性。并利用弱监督学习对多类分类器进行训练,不同于现有的全监督标注方法需要大量的人力对训练图像进行像素级别的真值标注,弱监督方式极大地降低了人工标注的难度,减轻了人工标注的工作量。在悉尼和华盛顿两幅遥感图像进行了标注实验,实验结果表明了本方法的有效性。