基于属性学习的零样本图像分类研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:tigerbi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
零样本图像分类是目前迁移学习领域的研究热点之一,与传统的图像分类问题不同,零样本图像分类在测试阶段所分类和识别的样本未参与分类器模型的训练。在零样本图像分类问题中,为了实现从可见类别到不可见类别的知识迁移,分类模型就需要通过视觉属性(属性)来搭建一座从底层特征到类别标签的桥梁。属性是指可以通过人工标注并且能在图像中观察到的特性,是图像内容的高层描述,能够同时被机器和人理解。大量的研究已经显示了属性学习在目标识别、图像描述以及零样本学习等方面的作用。首先,针对属性学习、零样本图像分类以及基于属性学习的零样本学习的国内外研究现状进行了分析。然后,分别从二值属性和相对属性两个方面入手,针对现有的基于属性学习的零样本图像分类所存在的不足进行改进。论文的主要工作包括:(1)传统的间接属性预测模型(IAP)假设样本的属性之间是相互独立的,即每个参与分类器训练的属性对于图像分类的重要性是相同的。然而在实际应用中,不同的属性对于分类的贡献程度不是完全相同的,因此这种假设会在一定程度上降低分类准确率。为此,提出一种基于关联概率的间接属性加权预测模型(RP-IAWP)。首先,分析属性与对象类别之间存在的相关关系;其次,采用关联概率对属性与类别之间的相关性进行量化度量;然后,根据属性与类别之间的关联概率为每个属性赋予相应的权重;最后,将属性权重引入传统的IAP模型中,并进一步将其应用于零样本图像分类。(2)对于具有相似属性的类别而言,在有限维度的语义属性下,基于属性的零样本图像分类器难以对它们进行正确区分。针对语义属性描述类别的有限性,在直接属性预测模型(DAP)的基础上,提出一种基于混合属性的直接属性预测模型(HA-DAP)。首先,对样本的底层特征进行稀疏编码并利用编码后的非语义属性来辅助现有的语义属性;然后,将非语义属性与语义属性构成混合属性并将其作为DAP模型的属性中间层,利用直接属性预测模型的思想进行混合属性分类器的训练;最后,根据预测的混合属性以及属性与类别之间的关系进行测试样本类别标签的预测。(3)传统的基于相对属性的零样本图像分类算法需要为每个属性单独训练一个属性排序函数,没有考虑属性与类别之间的关系。为此,提出一种基于共享特征相对属性的零样本图像分类算法(RA-SF)。首先,采用多任务学习的思想来共同学习类别分类器和属性分类器,进而得到二者共享的一个低维特征子空间;然后,利用这些共享特征来学习属性排序函数;最后,基于测试样本的属性排序得分,利用最大似然估计预测测试样本的类别标签。这种共享特征可以联系对象的类别及其相对属性,因此学习得到的属性排序函数将更加可靠,进而能够有效提高后续零样本图像分类任务的识别率。(4)针对传统的相对属性在解决零样本图像分类问题时,存在的模型分布假设不合理、建模受到人为主观因素的影响以及分类器性能不佳等多方面的不足,提出一种基于相对属性的随机森林零样本图像分类算法(RF-RA)。首先,通过自动挑选类别之间的相对属性关系来为每一个可见类与不可见类的样本建立属性排序得分模型;然后,利用所有样本的属性排序得分模型来训练随机森林分类器;最后,根据测试样本的属性排序得分以及训练得到的随机森林分类器对测试样本的标签进行预测。与传统的基于相对属性的零样本图像分类算法相比,RF-RA不仅可以避免人工建模所带来的不稳定性,而且还能降低最大似然估计方法带来的分类误差,并提高零样本分类的准确度。将所提零样本图像分类算法应用于场景识别数据集(OSR)、公开人脸数据集(Pub Fig)、属性发现数据库--鞋类数据集(Shoes)以及动物数据集(AWA),实验结果验证了所提算法的有效性和优越性。
其他文献
对鲁迅的散文诗《过客》的理解,通常尚在两种方式中进行:一是历史主义的,将它放在特定的历史情境中,作为鲁迅某一时期思想活动的表现,并根据历史的实际进程对这思想进行评述。于是
<正> 随着工业技术的发展,工业生产对木材和其他林产品提出了更高、更新的要求。各类用材实行定向培育,这是世界人工林发展出现的战略变化。杨树具有生长快、成材早、产量高
在国际环境的大背景下,全球化的逐渐深入与发展,为国家关系领域注入了新鲜的血液,衍生出心的价值理念,带领国际关系向着新方向发展。因此,在全球化发展的进程中,我们需要用全
所谓公允价值和以往的成本会计相比存在着不同的理论优势,它在实际的使用过程当中存在着一定的困难,因为除了公允价值自身的一些因素以外,还会涉及到相关利益集团的干涉因素
目的探讨TST联合消痔灵注射液治疗混合痔的安全性和有效性。方法收集2013年10月~2014年6月在本科住院并接受手术治疗的Ⅲ、Ⅳ度痔患者100例,随机分成治疗组和对照组,治疗组采
零样本分类的目标是对训练阶段未出现过的类别的样本进行识别和分类,其主要思路是,借助类别语义信息,将可见类别的知识转移到未见类别中.提出了一种直推式的字典学习方法,包
通过小角度中子和X射线散射对柱撑膨润土的结构和表面进行检验。小角度中子散射还提供了经NH3-H2O蒸汽亲水性处理的柱撑粘土孔隙系统渗水情况的信息。在近中性pH条件下,相比
对2004-2015年国内学界有关民族团结教育研究的样本文献进行计量分析发现:学界对该领域进行了不间断的探索,关于民族团结教育的研究总体呈现上扬态势,为推进我国民族团结教育
目的:探究一次性身体锻炼期间不同时段的情绪效益及其心肺活动特征。方法:60名被试在跑台上完成30 min中等强度定速(以前期自行调速实验中每个被试表现出的适宜跑速为固定跑速
<正>近几十年来,组织创新成为了学术界和管理实践界普遍关注的话题,然而组织创新归根结底源自于组织中的个体创新,因此如何提高组织中员工的创造力,鼓励他们表现出更多的创新