论文部分内容阅读
相似性度量是进行数据分类和聚类的基础,已经在机器学习和模式识别领域得到广泛研究。相似性度量的结果在很大程度上决定了后续算法的性能,从而,如何有效准确的度量数据间的相似性对于算法的有效性而言至关重要。本论文从数据相似性度量的基本问题入手、加入数据结构化属性的先验知识、结合图像中像素点的空间近邻关系、构建多种表示学习模型并将其应用于高光谱图像的分类问题和SAR图像的变化检测问题,重点解决高光谱图像中数据结构捕获不完整和SAR图像中斑点噪声对变化检测结果影响较大的实际问题。具体而言,本论文的主要工作包括以下五个方面:(1)提出了一种结合局部协同表示和自适应字典选择的高光谱图像分类方法。针对在协同表示分类中,当所有标记样本作为字典时,由于冗余和不相关样本的存在会出现降低表示性能的问题,提出了选择和测试像素最为相似的K个像素来构成新的字典并基于该字典来进行分类,以解决在冗余样本下协同表示不能精确表示测试像素和字典原子之间关系的问题。在字典原子选取之前,考虑到高光谱图像的空间一致性,通过对局部块内的像素进行均值化处理来包含近邻像素的空间信息。实验结果表明,所提算法在分类精度上要优于支撑矢量机和其他基于空-谱表示的分类方法。(2)提出了一种基于局部约束的协同子空间聚类方法来进行高光谱波段选择。该方法在子空间聚类的框架下,能同时获取波段之间的全局和局部结构。每一个波段都可以看做是图中的一个顶点,波段之间的相似性可以通过表示系数来度量。所提出算法的两个主要贡献点在于:一是使用了一种协同子空间表示方法来获取所有波段间的全局结构;二是使用了一种基于数据局部属性的图形式来保留相似波段在谱空间和表示空间之间相似度的一致性。最终将离聚类中心最近的波段标记为所选择的波段。在高光谱图像分类的实验结果上验证了所提出算法的有效性。(3)提出了一种基于局部约束的低秩表示构图方法,并结合基于图的半监督分类方法进行人脸和手写体图像分类。所提算法是在低秩表示的基础上引入了数据的局部信息。秩约束能够获取数据的全局结构,因此,所提算法能够同时通过低秩表示来获取数据的全局结构和通过局部正则约束项来得到数据的局部结构。该正则项从局部假设而来,即相似的样本应该具有较大的表示系数。我们在提出的算法中使用了低秩表示来衡量样本之间的相似度。考虑到表示系数在物理解释上的非负性约束,该正则项可以改写为一个加权的?1范数。接着,使用了一个基于局部和全局一致性的半监督学习方法来进行图像分类。所提算法在三个人脸和一个手写体数据库上的实验结果表明其能够得到更好的数据结构的表示和比其他对比算法更高的分类精度。(4)提出了一种基于显著性和K均值聚类的SAR图像变化检测方法。显著性区域在图像中明显的区分于其他区域,能够很容易的被发现。局部区域间的强烈对比使得显著性适合用来引导SAR图像的变化检测,因为两幅图像之间存在一个变化/差别区域。首先利用显著性提取了初始差分图中的感兴趣区域,然后通过一个简易的阈值化处理提取富含信息最多的区域并舍弃那些非感兴趣区域。针对提取的显著图来提取两幅原始SAR图像中的区域,用PCA来提取局部块的特征以包含局部空间信息,最后通过K均值聚类来得到最终的变化图。在五个真实和两个仿真SAR图像上验证了所提算法的有效性。(5)提出了一种基于对数比值算子和非局部低秩矩阵分解的SAR图像变化检测方法。对数比值算子已经被广泛地应用于SAR图像差分图的生成。SAR图像中的乘性噪声可以通过对数比值算子转化为加性噪声,其符合SAR的机理。然而,这样一种像素级操作会在差分图中产生很多孤立像素并将降低变化检测算法的性能。将从一个大的搜索区域得到的像素块进行堆积得到一个非局部块的矩阵,由于数据间的相似性使得该矩阵具有明显的低秩结构,从而,提出将该矩阵分解为三部分:低秩部分,稀疏杂点和小幅度的冗余杂点,其中的低秩部分对应着一个较为干净的差分图,其他部分对应着由斑点噪声引起的杂点。最后,我们使用PCA和K均值聚类方法将得到的低秩部分进行特征提取和聚类以得到最终的变化图。该算法能够很好的处理斑点噪声带来的变化图中孤立点较多的问题。