论文部分内容阅读
近年来,随着传统稀疏表示人脸识别方法的发展,关于稀疏判别性字典学习算法的研究与应用也越来越多,因其良好的学习效果,在图像分类任务中取得了不少优异的结果。这些单层字典学习方法虽能为特定类别的样本学习到强判别力字典,但针对数据维度过高或样本数量较大的情况,这种单层结构字典所含信息对分类任务而言是远远不够的。为了获取复杂图像集更有效的图像信息,Snigdha等人鉴于深度学习方法在图像分类领域的优势,提出的深度字典学习方法将传统单层字典学习方法中的稀疏表示系数定义为特征,其首先通过原始样本获得第一层的字典和特征,接着基于第一层的特征获取下一层的字典和特征,依次学习最终得到最深层次的字典和特征。此方法不仅学习到更深层次的字典还获得了更多样化且具表征性的深层特征,这种深层结构的特征更益于复杂图像的分类任务,且比单层特征表现出更好的分类效果。虽然深度字典学习方法能够获得更深层结构的字典和特征,但考虑到深度字典学习模型层数增多会导致原始样本的信息易丢失,反而不利于算法分类性能的提升。因此,本文基于稀疏表示和深度字典学习的思想,结合原始样本的图结构信息和类别结构信息,使通过深度字典学习方法获取的深层结构特征不仅有稀疏特性,且针对复杂图像分类任务具有判别性,并融合L2,1模以增加算法适应特征对象旋转变化的能力。最后在公开数据集上验证本文改进算法的有效性和优越性。本文的主要工作内容总结如下:1)提出了基于图结构的深度字典学习算法。利用原始样本信息及其在空间结构上的局部邻接关系信息来构造图结构,对最深层的稀疏特征施加图正则化约束,使获得的深层特征与原始样本在几何结构上具有相似的邻接关系,尽量避免原始样本在经过多层网络学习后丢失其本身所含有的细节信息,同时提高算法对原始样本的重构表达能力,使获得的深层特征拥有更好的判别能力,以增强分类效果。并在人脸库及手写数字库上验证本算法在分类任务上的有效性和优越性。2)提出了基于标签一致性的深度字典学习算法。根据原始样本的类别结构信息,构造判别性的稀疏编码,对深层稀疏特征施加标签一致性约束,使获取的深层特征与原始样本具有相似的类别结构,并保持类间一致性,尽量避免样本在经过深层学习后丢失有益于分类的类别信息,且获取具有类判别性的深层特征。并在人脸库与手写数字库上验证该算法在分类任务上的有效性和优越性。3)提出了将L2,1模与上述深度字典学习模型相结合的算法。由于L2,1模具有旋转不变性,利用L2,1模对深层特征施加行稀疏约束,不仅可以更好的挖掘出原始样本的关键特征,且可进一步使得算法具备一定的应对特征对象旋转变化的能力。最后验证加入L2,1模的优势。