论文部分内容阅读
随着计算机硬件性能的极大提升,人工智能与模式识别技术得到了前所未有的发展。协作表示作为一种经典的基于表示的模式识别方法,凭借其高效和有效的分类性能,吸引了大量学者的关注。协作表示利用所有训练样本协同地表示测试样本,忽略了每类表示的可鉴别性,而后者对于分类任务是至关重要的。因此,为从训练数据中学习到可鉴别的每类表示以进一步提升基于表示的方法的分类性能,本文主要做出如下三个方面的工作:(1)为降低协作表示中每类重构表示的相关性,提出可鉴别协作近邻表示(DCNR)方法。DNCR不仅增强了每类表示的可鉴别性,而且利用了数据的局部信息。在协作表示中,表示系数能够反映训练样本与测试样本的相似性信息。DCNR利用测试样本与每个训练样本的距离信息来约束该训练样本对应的表示系数,使得与测试样本相近的训练样本能够获得较大的重构贡献。因此DCNR能够选择与测试样本相近的训练样本有判别力地重构测试样本。为处理随机像素点污染或块遮挡等有噪声图像的识别问题,DCNR被拓展为基于l1范数保真项的R-DCNR。开展在七个数据集上的实验证明了提出的DCNR和R-DCNR方法出色的分类性能和鲁棒性。(2)虽然增强协作表示的可鉴别性有助于改善分类,但每类表示的可鉴别性并不能明确强调测试样本与其所属正确类的相似性。为此,提出加权可鉴别协作竞争表示(WDCCR)方法。在WDCCR中,协作表示的分类阶段被融入到表示阶段,从而引导每类训练数据竞争地表示测试样本,同时借助于可鉴别性约束项,每类与其它类重构表示的相关性被降低。此外,两个反映测试样本与每类训练数据本质关联信息的权重被设计用于进一步改善每类的竞争表示和不同类别间的可鉴别性。同样,基于l1范数保真项的WDCCR拓展方法(R-WDCCR)被提出,用于校验模型识别有噪声图像的能力。六个数据集上的分类实验证明了提出的WDCCR和R-WDCCR的优越分类性能和较好的抗噪能力。(3)多数字典学习方法不能有效地从训练数据中学习到每类可鉴别和简洁的信息。为此,提出可鉴别多字典学习(DMDL)方法。DMDL中有三种类型的字典,即均值字典、变体字典和通用字典。均值字典由每类训练数据的均值直接得到,反映了每类训练数据的泛化特征。变体字典从每类训练数据中学习得到,保存每类简洁的和可鉴别的信息。从所有类训练数据中学习到的通用字典,保存了所有训练数据可能存在的公有属性。由于三种字典能够相互补充和相互促进,DMDL能够获得样本在正确类上的真实表示,从而正确分类。在五个数据集上的实验,对比了多个目前先进的字典学习方法和基于表示的分类方法,验证了提出的DMDL方法对于分类任务的有效性。