论文部分内容阅读
图像特征提取与分类是计算机视觉、模式识别与图像处理中最重要的研究课题之一,近几十年来一直广受研究者关注。同时,图像特征提取与分类也是众多计算机视觉和图像处理课题如场景理解、目标检测、图像检索和医学图像分析等的研究基础,它们的表现直接影响着这些后续研究工作的性能。本文分析了图和超图学习在图像特征提取与分类中的研究现状以及超图相对图的结构优势,从子空间学习、超图构建与属性学习三个方面入手,围绕超图学习在图像特征提取与分类中的应用进行研究。论文的主要研究工作和创新点如下:①针对判别局部保留投影(Discriminant Locality Preserving Projections,简称DLPP)算法只能通过同类样本之间的两两几何关系来近似描述样本的类别关系的不足,本文提出了一种新的有监督的子空间学习方法——判别超拉普拉斯投影(Discrimiant Hyper-Laplacian Projections,简称DHLP)算法。DHLP算法首先有监督地构建超图以利用超边直观地描述样本的类别关系,然后利用该超图的拉普拉斯矩阵替换DLPP算法中原来基于普通图的拉普拉斯矩阵以学习一个能够保留样本类别关系的子空间用于图像特征提取。大量实验表明DHLP算法对DLPP算法的判别能力具有显著的提高。此外,从图嵌入的角度来看,诸多子空间学习算法都可以归纳为与DLPP算法类似的图学习问题,因此DHLP的算法思想也可以被推广到这些算法上。②针对DHLP算法的算法复杂度过高的问题,本文提出了可扩展判别超拉普拉斯投影算法(Scalable Discriminant Hyper-Laplacian Projections,简称SDHLP)。在SDHLP算法中,DHLP问题被近似为一个谱回归问题进行求解。SDHLP算法不仅能把算法复杂度从关于特征维度三次方降低为线性次,还能取得和DHLP算法类似的性能。③针对传统超图构建方法在数据描述上准确性与鲁棒性的不足,本文提出利用回归模型构建“高质量”超图的算法框架——回归超图(Regression-based Hypergraph,简称RH)模型。并以稀疏表示(Sparse Representation,简称SR)与协同表示(Collaborative Representation,简称CR)两个回归模型为例子分别构建了1-范数超图和2-范数超图来解决图像聚类和分类问题。实验表明1-范数超图和2-范数超图继承了SR和CR算法的优点。它们不仅比传统超图具有更强的判别能力,而且对噪声和遮挡都具有良好的鲁棒性。④针对传统属性学习方法无法利用属性之间相关性的缺点,本文提出了超图正则化属性预测器(Hypergraph regularized Attribute Predictor,简称HAP)算法。受DHLP算法以及基于超图的直推算法的启发,HAP算法利用属性标签有监督地构建一个超图来直观地描绘样本之间属性关系(每条超边对应一个属性关系)并把属性预测问题视作一个正则化超图分割问题。在分割超图过程中,如果一个顶点集(样本集)共享大量的超边,分割这个顶点集将会招致严重的惩罚。因此,属性之间相关关系在HAP算法中能够很好地保留。在HAP算法中,超图切被视为样本的属性预测,最优的超图切可以通过同时最小化超图结构的损失和属性预测误差学习获得。从图嵌入角度上来看,超图切是超图的嵌入,因此属性预测器可以通过学习样本空间到超图嵌入空间的映射导出。三个权威属性图像数据库上的实验结果表明HAP算法在零/N样本学习、属性预测以及图像数据分类中都能取得良好的表现。此外,值得一提的是HAP算法应该是首个有监督超图分类器。⑤为了在属性学习过程中灵活地利用额外可用信息,HAP算法被进一步推广为一个多图分割模型。在该模型中,一个图或超图被利用来描绘不同额外信息并被作为惩罚项加入到HAP模型以保证在属性预测中能够充分考虑到这些额外信息的损失。本文以类别信息为例子提出了类特定HAP算法(Class Specific HAP,简称CSHAP)以利用类别信息进一步提升属性的分类能力。实验结果验证了我们提出的假设。⑥核化HAP与CSHAP算法以支持非线性的情况。在现实世界中,样本和属性之间的关系通常不是简单线性关系而是更为复杂的非线性关系,因此,核化本文提出的算法可能会进一步提升算法的性能。