基于训练样本属性约束的零样本识别算法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:weiwen2100000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统监督学习存在以下几个弊端:(1)给训练样本标注标签需要耗费大量人力和时间,代价昂贵。(2)可能会出现很难收集到某些类测试样本的同类训练样本。(3)在训练样本上学习的分类器泛化性能不高,即标签预测准确率较低。基于上述三个不足之处,有专家学者提出用零样本识别代替传统监督学习。零样本识别可以减少训练成本,同时显著提高识别率,因此具有巨大研究价值和广泛应用前景。零样本识别是利用已知标签训练样本的语义知识迁移完成测试样本标签预测,但是训练集和测试集没有交集,从训练样本学习的属性分类器必然无法完全适用于所有未见过的测试样本,会导致测试样本的预测属性不准确,与未知类别类原型属性发生偏移,即产生语义迁移问题。因此,研究如何缓解语义迁移对零样本识别的影响有重要意义,我们的主要工作如下所示:第一,我们提出了基于类间属性约束的语义自编码算法(SAOICAC算法)。此算法针对当前主流的SAE算法用类原型属性代替样本属性这一缺陷提出的。首先,我们在训练样本上基于语义自编码和视觉语义相似性约束一起学习属性分类器。然后,通过训练的属性分类器预测测试样本未知属性。最后,利用标签分类器获得测试样本标签。SAOICAC算法识别率远高于SAE算法,同时还可以提高识别速率。第二,在SAOICAC算法的基础上,我们提出了基于类间属性约束的双语义自编码算法(SDAOICAC算法)。SDAOICAC算法是鉴于SAOICAC算法识别率还受语义迁移影响较大的缺陷而提出的进一步改进算法。首先,在训练样本集和测试样本集上共同训练属性分类器。然后,利用属性分类器获得测试样本属性。最后,我们通过标签分类器将测试样本与未知类别类原型属性进行比对来得到测试样本标签。实验结果表明SDAOICAC算法识别率较之SAOICAC算法又有进一步提高。第三,我们提出了基于类内属性约束的语义自编码算法(SAWICL算法)。SAWICL算法是在SAE算法基础上结合类内样本属性相似性约束提出的。首先,在训练样本上基于语义自编码和类内样本属性约束一起训练属性分类器。然后,利用迭代得到的最优属性分类器学习测试样本属性。最后,我们使用标签分类器在属性空间中对测试样本进行识别。大量实验表明SAWICL算法可以大大提高识别率,减少语义迁移问题对零样本识别的影响。为了验证三个改进算法的正确性,我们分别在动物属性数据集(Animal with Attributes)、加州理工学院鸟类数据集(Caltech UCSD Birds)和雅虎数据集(aPascal-aYahoo)上和当前主流零样本识别算法进行对比。实验结果表明我们的三个改进算法均可以显著提高识别率,有效减少语义迁移对零样本识别的影响。
其他文献
目的了解肩胛颈骨折并同侧锁骨骨折的手术时机是否会对肩关节功能恢复产生影响。方法回顾性分析2016年1月至2017年12月在西安市红会医院骨显微修复外科手术治疗的肩胛颈骨折
宜昌丝竹是我国的一种乐器合奏形式,主要流行于湖北省宜昌市的东北地区,以夷陵区为轴心覆盖,邻宜昌,荆州,江陵,松滋。多年来一直较少有理论资料。竹笛是中国最古老的乐器之一,上可追溯到贾湖骨笛,同时竹笛在中国民族乐器中扮演者不可缺少的角色,并且在宜昌丝竹中竹笛作为主要声部之一,支撑宜昌丝竹的旋律发展,笔者通过总结前人的文献,及结合自己的思考,对宜昌丝竹及其竹笛声部的演奏技巧进行了初步的研究。文章的正文部
概括介绍了果园的灌溉技术和保摘技术。
粉防己碱(tetrandrine,TET)是粉防己的主要活性成分,临床上已作为抗风湿药及抗癌增效药,用于风湿病、关节痛、神经痛、肺癌和矽肺的治疗。粉防己碱溶解性差,口服不易被吸收,
在欧美文学作品中,作者所表达的思想情感都会以修辞的手法表达其生动的内容。在后现代文化思潮的冲击下,欧美文学中的修辞方法发生了改变。后现代文化思潮形成后,对于当代欧
本课题分三部分,分别从材料性能、尸体标本实验、及临床应用三个方面探讨将国产灌注剂用于经皮椎体成形术(PVP)的可行性。 第一部分:国产灌注剂行经皮椎体成形术的材料性能研
电大尺寸目标电磁散射特性的研究长久以来都是计算电磁学领域的热点和难点。本文采用MPI-OpenMP混合并行多层快速多极子方法,力求精确、高效的求解电大尺寸导体目标和涂敷目标
随着目前我国的房地产行业蓬勃发展,人们对居住环境有了新的要求,因此住宅区的绿化环境设计也尤为重要,它关系到居民的居住心情和感受,也是关系小区自然生态系统的是否和谐发
目的:比较经腹会阴联合切除术和经内外括约肌间切除术治疗低位直肠癌患者术后生活质量及营养状况的差异,以及术后两年内局部复发和远处转移率,旨在为低位直肠癌患者手术方式
实际的被控系统中,众多被控对象发展变化规律可用中立型泛函微分方程的数学模型描述,所表达的中立型时滞系统,使得控制理论的内容更加丰富,成为了重点研究的被控系统之一。滑