论文部分内容阅读
近年来,随着CPU,内存等硬件设备的快速发展,模式识别、图像处理和计算机视觉等领域面临数据维数越来越大,数据处理时间越来越长等问题。稀疏表示因其在解决数据量过大的问题上有很大优势而受到很多学者关注,而且经过稀疏表示处理的数据样本对噪声具有很强的鲁棒性,对后续的分类精度提升起到很大作用。本文主要研究将稀疏表示方法运用在降维算法,特征提取算法等图像处理算法上,并且通过大量实验验证了本文提出算法的有效性,主要的工作包括:(1)特征提取算法通常只单独用到了数据的局部结构或者整体结构,这样将得不到全局最优投影矩阵,且投影矩阵不具备很好的可解释性。为此,本文提出了一种基于邻域图的低秩投影学习算法。该算法通过在数据的重构残差上施加图约束来保持数据的局部结构,同时引入低秩项来保持整体结构;算法利用L2,1范数行稀疏的性质对投影矩阵进行约束,这样可以剔除冗余特征,提高投影矩阵的可解释性;并且算法引入噪声稀疏项来减弱样本本身存在噪声的干扰。模型采用交替迭代方法求解,在多个数据集上的实验结果表明该算法能有效地提高分类精度。(2)局部线性嵌入作为经典的数据降维算法已应用于图像处理领域,但其忽略了样本之间的差异性,从而影响模型的性能。为此,本文提出基于自步学习的鲁棒稀疏嵌入算法。该算法首先对数据样本进行邻域中心化,从而保持数据的邻域结构;其次,将自步学习理念引入算法中,通过自步正则化函数,使训练模型先处理样本差异小的样本,后处理样本差异大的样本,并且使用L2,1范数约束投影矩阵,使算法对噪声和异常值具有很强的鲁棒性,并且在多个数据集上验证了算法的有效性。(3)传统的子空间学习算法包含投影学习和分类两个过程,但是分离了这两个过程,且对离群点较敏感,可能导致算法无法获得整体最优解。为此,本文提出了一种基于局部保持投影的鲁棒稀疏子空间学习算法。该方法将特征学习和分类模型相结合,使学习得到的子空间特征更具判别性;其次,利用L2,1范数的行稀疏性质,剔除冗余特征,同时在算法模型中考虑数据样本的局部关系来提高对离群点的鲁棒性。最后,采用交替迭代来求解该模型。在不同数据集上的实验结果表明该算法具有较好的识别效果。