论文部分内容阅读
高阶张量分解与稀疏表示成为模式识别与图像分析领域中的有力工具。许多实验结果都呈现出了显著的识别性能。对张量数据使用高阶奇异值分解得到人脸图像在不同光照、表情、姿势以及身份条件下的低维表示,从而基于张量子空间的学习算法能够更好地揭示流形内在的几何结构。稀疏表示分类采用L1正则化的回归模型,可以有效地提高算法的泛化能力。
双向主成分分析方法(BDPCA)在本质上属于双线性方法,它首先构造出图像协方差矩阵(行协方差阵与列协方差阵),然后求出对应的特征向量作为投影向量。因为这两个协方差阵的大小分别等于图像的宽度与高度,所以相对于主成分分析(PCA)中的协方差阵而言,维数减小了很多。双向主成分分析不仅减少了人脸识别所需的投影向量个数,同时在识别精度上也达到了很高的性能。然而,该方法一直都应用于批量训练的模式,也就是说,所有的训练样本都必须在计算投影向量之前输入到训练系统,如果有额外的样本被采集,则相应的投影向量必须被整个训练集重复更新。更主要的是,散度矩阵表示为所有图像协方差矩阵之和,这就使得在散度上的增量学习更加困难,因此对在线学习提出了新的挑战。为了克服这些困难,我们借助于高阶张量分解、k-模式展开与矩阵化等概念,提出了基于奇异值修正的双向主成分在线学习算法,在多个不同数据库上的实验结果表明,在线学习算法可以高效地应用于人脸识别。
矩阵的广义低阶逼近(GLRAM)方法,已经在模式识别和机器学习领域取得了广泛的应用。该方法通过迭代优化进一步寻求图像在行与列空间中的最佳投影方向。我们提出使用双向Lanczos成分逼近由特征值分解得到的投影向量,每一个样本点都以二维矩阵的形式存在,而不需要将其转化为一维向量形式,从而避免复杂度较高的特征值分解。该方法逐步减小基于Frobenius范数优化问题的重构误差,并且导致逼近性能在连续的迭代过程中不断提高。另外,关于参数选择,我们也将给出理论线索以寻求合适的投影个数。在人脸识别与图像分类问题上的实验结果表明,双向Lanczos成分方法仅仅使用较少的Lanczos向量来实现降维和特征提取,因而是十分高效的,不仅得到了高于其他主要方法的识别率,而且在计算时间上有了明显的改进。
压缩感知(CS)理论与稀疏表示(SR)方法近来得到快速发展并受到了许多学者的推崇。压缩感知理论一经提出,就在信息论、信号/图像处理、模式识别、无线通信等领域受到高度关注,并被美国科技评论评为2007年度十大科技进展。目前CS理论的研究尚属于起步阶段,但已表现出强大的生命力,并成为数学领域和工程应用领域的一大研究热点。J.Wright等人将稀疏表示方法引入到人脸识别领域中,不仅进一步拓广了压缩感知的应用空间,而且让人们对人脸识别产生了更高层次的新认识。与传统的判别方法相比,压缩感知方法不仅能够避免广义特征值分解带来的复杂计算与奇异问题,而且有效地提高了算法的泛化能力。然而,我们在实验仿真过程中发现,当训练样本较少时,先通过随机投影降维,然后使用稀疏表示方法分类,相应的识别效果反而不如传统的线性判别方法或流形学习方法。因而,进一步提高特征的冗余性与组合系数的稀疏性,就显得十分必要。弹性网理论是最近统计学和生物信息学领域发展起来的模型选择方法,它是对传统的L2理论的新发展,采用L1惩罚与L2惩罚相结合,可以用来保持系统的稳定性能。我们将弹性网正则化方法应用于稀疏表示模型,得到了比原方法更加稀疏的表示和更加稳定的结果,同时得到了更高的人脸识别率。
假设数据是均匀采样于一个高维欧氏空间中的低维流形,流形学习(Manifoldlearning)就是从高维采样数据中恢复低维流形结构,即找到高维空间中的低维流形,并求出相应的嵌入映射,以实现维数约简或者数据可视化。由此,我们可以通过线性关系来刻画这些对象的局部近邻结构。正交近邻保持投影方法(ONPP)构造出近邻图来对数据拓扑结构进行建模,它的权重根据每一个节点的近邻几何特征来确定。对于最佳线性投影的计算,将限制每一个样本点在低维空间中近邻之间的权重保持与原始高维空间中的近邻权重相同,然后得到从输入空间到输出空间显式的线性投影,因而显得非常简便。但是,从认知对象当中提取的特征可能会包含高阶结构。在揭示这些内蕴结构的时候,如果忽略对象本身的结构特点,而单纯地将先转化为一维向量,就会破坏其固有的本质特征,并导致“维数灾难”。我们将正交近邻保持投影方法推广到2阶张量形式,并在人脸识别实验中取得了很好的效果。