论文部分内容阅读
零样本图像分类是目前迁移学习领域的研究热点之一,与传统的图像分类问题不同,零样本图像分类在测试阶段所分类和识别的样本未参与分类器模型的训练。在零样本图像分类问题中,为了实现从可见类别到不可见类别的知识迁移,分类模型就需要通过视觉属性(属性)来搭建一座从底层特征到类别标签的桥梁。属性是指可以通过人工标注并且能在图像中观察到的特性,是图像内容的高层描述,能够同时被机器和人理解。大量的研究已经显示了属性学习在目标识别、图像描述以及零样本学习等方面的作用。首先,针对属性学习、零样本图像分类以及基于属性学习的零样本学习的国内外研究现状进行了分析。然后,分别从二值属性和相对属性两个方面入手,针对现有的基于属性学习的零样本图像分类所存在的不足进行改进。论文的主要工作包括:(1)传统的间接属性预测模型(IAP)假设样本的属性之间是相互独立的,即每个参与分类器训练的属性对于图像分类的重要性是相同的。然而在实际应用中,不同的属性对于分类的贡献程度不是完全相同的,因此这种假设会在一定程度上降低分类准确率。为此,提出一种基于关联概率的间接属性加权预测模型(RP-IAWP)。首先,分析属性与对象类别之间存在的相关关系;其次,采用关联概率对属性与类别之间的相关性进行量化度量;然后,根据属性与类别之间的关联概率为每个属性赋予相应的权重;最后,将属性权重引入传统的IAP模型中,并进一步将其应用于零样本图像分类。(2)对于具有相似属性的类别而言,在有限维度的语义属性下,基于属性的零样本图像分类器难以对它们进行正确区分。针对语义属性描述类别的有限性,在直接属性预测模型(DAP)的基础上,提出一种基于混合属性的直接属性预测模型(HA-DAP)。首先,对样本的底层特征进行稀疏编码并利用编码后的非语义属性来辅助现有的语义属性;然后,将非语义属性与语义属性构成混合属性并将其作为DAP模型的属性中间层,利用直接属性预测模型的思想进行混合属性分类器的训练;最后,根据预测的混合属性以及属性与类别之间的关系进行测试样本类别标签的预测。(3)传统的基于相对属性的零样本图像分类算法需要为每个属性单独训练一个属性排序函数,没有考虑属性与类别之间的关系。为此,提出一种基于共享特征相对属性的零样本图像分类算法(RA-SF)。首先,采用多任务学习的思想来共同学习类别分类器和属性分类器,进而得到二者共享的一个低维特征子空间;然后,利用这些共享特征来学习属性排序函数;最后,基于测试样本的属性排序得分,利用最大似然估计预测测试样本的类别标签。这种共享特征可以联系对象的类别及其相对属性,因此学习得到的属性排序函数将更加可靠,进而能够有效提高后续零样本图像分类任务的识别率。(4)针对传统的相对属性在解决零样本图像分类问题时,存在的模型分布假设不合理、建模受到人为主观因素的影响以及分类器性能不佳等多方面的不足,提出一种基于相对属性的随机森林零样本图像分类算法(RF-RA)。首先,通过自动挑选类别之间的相对属性关系来为每一个可见类与不可见类的样本建立属性排序得分模型;然后,利用所有样本的属性排序得分模型来训练随机森林分类器;最后,根据测试样本的属性排序得分以及训练得到的随机森林分类器对测试样本的标签进行预测。与传统的基于相对属性的零样本图像分类算法相比,RF-RA不仅可以避免人工建模所带来的不稳定性,而且还能降低最大似然估计方法带来的分类误差,并提高零样本分类的准确度。将所提零样本图像分类算法应用于场景识别数据集(OSR)、公开人脸数据集(Pub Fig)、属性发现数据库--鞋类数据集(Shoes)以及动物数据集(AWA),实验结果验证了所提算法的有效性和优越性。