论文部分内容阅读
近几年来,机器学习和人工智能已经得到了迅速的发展,如人脸识别和行为检测等计算机视觉任务在实际场景中已经得到了重要的使用。在传统的机器学习方法中,监督学习凭借着训练数据的标签信息,一直发挥着最为重要的作用。然而,在大多数实际应用中,标签训练数据通常非常有限,而获取大量的未标记训练样本相对容易,因此,只需少量标注样本的半监督学习近几年来已引起研究人员的高度关注。在半监督学习中,半监督字典学习的方法是最具有前景的方向之一。这类算法的核心是如何通过少量的标注样本,来学习具有鉴别性的分类器字典,此外,不同的编码表示方式以及加入不同的鉴别项,都会对最后所学字典的分类能力有比较重要的影响。本文提出了两种不同的鉴别性半监督字典学习算法,在不同的图像分类应用中,如自闭症诊断,人脸图像识别,字符识别和目标分类任务中,均取得了比现有方法更高的识别精度。具体贡献如下:首先,提出了一个提升的标签传播算法与半监督字典学习相结合的方法,该方法基于同类数据存在共性和特异性的假设,采取了对样本数据进行共性和特异性的联合编码方式,同时,改进的标签传播算法将更加准确地估计非标签样本在各个类别上的所属概率。最后,我们在四个来自不同大学采集的自闭症数据集上进行实验,实验结果表明我们的半监督字典学习方法取得了比现有方法更好的识别率。其次,我们提出了一个基于最大熵的半监督字典学习方法,其中,最大熵的正则项能有效地避免非标签样本在不确定类别上的过度估计,这样使得非标签样本在字典更新迭代中,能不断地接近真实的样本类别空间。同时,联结的字典优化和非标签样本概率更新使得我们的方法更具有解释性。通过在Extended YaleB,LFW人脸数据库,USPS和MNIST字符库,Texture25目标分类库上的实验结果,可以看出我们提出的方法比现有方法在诸多模式识别任务中取得更优秀的性能。综上所述,本论文提出了基于半监督字典学习的图像分类任务,通过对数据本身的假设,即数据存在共性和特异性,以及不同鉴别项的引入,使得我们的方法更有效地挖掘非标签数据本身的鉴别性信息,从而使得所学习的字典分类器具有更强的分类能力。