基于语义信息的小样本学习算法

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:lijie041132
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着人工智能领域的快速发展,日常生活中的方方面面都有了深度学习的身影。其在计算机视觉,自然语言处理,多智体强化学习等方面都发挥着至关重要的作用。由于深度学习网络参数众多,往往需要足够多的标注数据进行训练,才能避免过拟合问题,从而得到具有一定泛化能力的模型。然而受限于高昂的标注成本和数据稀缺等一系列问题,如何利用少量的标注数据进行深度学习逐渐引起了人们的高度关注。现有的小样本学习方法主要聚焦于图像分类领域,意在学习一个分类器来预测图片所属的类别。现如今小样本学习在传统图像分类设定下的研究成果众多,相比之下,其他更具有实践意义也更为困难的领域则发展缓慢。本文主要聚焦于小样本学习领域中的零样本学习和小样本增量学习两个子领域。其中前者试图对没有任何标注数据的类别进行分类,该设定可以很好地处理由于隐私等问题造成的标注数据缺失。而后者则想要为不断到来的小样本流数据训练分类器,来为模型提供增量学习能力,适应数据不断到来的现实场景。在零样本学习方面,本文提出的基于异构图知识迁移算法(Heterogeneous Graph for Knowledge Transfer)针对现有模型数据关联利用效率低下的问题,在构建数据关联时利用语义模态信息同时考虑类内和类间的关系,构建出异构图拓扑结构来准确地表达数据间的关联信息。同时本文基于构建后的异构图,采用图神经网络学习从语义空间到视觉特征空间的反向映射,既缓解了零样本学习中的枢纽点问题也有效地对知识进行迁移,通过利用邻居信息准确地表示看不见的类别。在小样本增量学习方面,针对现有类别标注数据不足和模型面临灾难性遗忘两个难题,本文提出了多模态多模型小样本增量学习算法(Multi-Modal Multi-Model Few-shot Incremental Learning)。本文通过引入语义模态信息并和视觉特征信息相融合,引导模型学习出更准确的决策边界。同时本文通过利用多个历史模型进行知识蒸馏约束现有模型的学习,来更有效地缓解灾难性遗忘的发生。此外,本文将整个小样本增量学习建模成双层优化问题,并通过交替迭代的学习方式得到更好的效果。本文主要贡献点如下:1.本文针对当前主流零样本学习算法中数据关联利用效率低下的问题,提出了根据语义模态信息构建异构图的方式来同时利用类内和类间的关联信息,更加准确地建模数据之间的拓扑结构。同时,本文通过在Wasserstein度量下选择代表节点构建类间关系,使得选取的代表节点更能反映出该类别具有的共有特征,从而有利于分类器决策边界的学习。2.本文提出的基于异构图知识迁移算法是基于图神经网络的归纳式零样本学习算法,其在训练过程中对测试数据的任何信息都不可见。基于构建后的异构图,本文学习得到嵌套函数和聚合函数,对于测试类别通过聚合其邻居信息,准确地获得测试类别在嵌套空间中的相对位置,进而提高模型的分类准确率。本文提出的基于异构图知识迁移算法在多个公开数据集上取得了不错的实验效果,充分说明了该算法的有效性。3.在小样本增量学习领域,本文通过将语义模态信息和小样本视觉特征信息相融合,利用两种模态的信息学习决策边界,使得模型能够在增量学习阶段为新到来的类别学习得到效果不错的分类器。此外,由于单一历史模型并不足以提供足够的约束信息,本文还提出了多模型知识蒸馏损失,通过多个历史模型共同约束指导现有模型的学习,更有效地缓解灾难性遗忘的发生。4.本文提出的多模态多模型小样本增量学习算法将小样本增量学习建模成双层优化问题,通过对上层防止模型灾难性遗忘优化目标和下层增量阶段分类器学习优化目标的交替迭代求解,得到了准确率更高的模型,并在多个公开数据集上取得了不错的效果。此外,各种消融实验也验证了算法各个模块的有效性。
其他文献
核桃(Juglans regia L.)是我国重要的“木本粮油”生态树种,被称为“21世纪的超级食品”,其丰富的营养成分对人类健康有益,具有良好的经济价值和社会效益。随着其种植面积的不断扩大,核桃的病害日趋严重,其中叶斑病是主要病害之一。相关病害的发展目前已经成为核桃产业发展面临的严峻问题。本研究通过高通量测序技术对健康叶与病症叶间微生物种群的物种多样性、丰富度、动态变化规律等进行了细致的分析,找
能源作为现代社会发展的支柱型产业,具有举足轻重的地位,其中氢能以燃烧热值高、产物无污染、资源丰富的优势,成为21世纪最受欢迎的清洁高效能源。目前,氢能的高效利用主要依靠燃料电池(FCs)装置,FCs阴极和阳极的主要反应分别为氧还原反应(ORR)和氢氧化反应(HOR)。然而ORR/HOR对Pt等贵金属催化剂的重度依赖限制了燃料电池的商业化发展。因此,寻找低成本高活性的非贵金属催化剂十分必要。过渡金属
良性特发性位置性眩晕(Benign Paroxysmal Positional Vertigo,BPPV)是临床上一种常见的周围性前庭疾病,其多发病于中老年人。BPPV的主要病理表现为前庭末梢器官病变,粘附在内耳球囊和椭圆囊斑上的碳酸钙盐结晶脱落。通常,BPPV患者头部位置改变时会产生强烈眩晕,同时出现眼颤症状。一直以来,关于BPPV的研究多从其发病诱因、诊断标准、治疗方法方面展开。然而长期外围输
草酸二甲酯(DMO)加氢制乙醇酸甲酯(MG)(DMO-to-MG)不仅有利于促进石化产业原料多元化,更有助于填补聚乙醇酸(PGA)市场空缺。磷化镍催化剂以其高MG选择性、效果稳定以及价格低廉的特点在DMO-to-MG逐步受到关注,但该催化体系目前主要存在以下问题:DMO无法深度转化或/和载体的酸性造成副反应的发生。因此,本文围绕温和条件下高效DMO-to-MG反应过程的构建,以Ni3P为活性组分、
级联生物催化反应是一类重要的化学转化,在生物信号转导和代谢途径中发挥重要作用。在生物系统中,复杂的生物催化级联过程发生在不同的细胞膜分隔的细胞器中,以防止出现干扰,从而产生效率极高的生物产品。在自然系统中模拟多酶催化级联反应,在受限结构中的空间组织在新兴的系统化学领域中得到越来越多的关注。为此,研究人员开发了多种生物微反应器,但它们仍难以满足模拟细胞反应途径的复杂性。在这项工作中,我们开发了金属有
茶树油作为植物精油,具有天然的抗菌、抗炎、抗病毒、抗肿瘤、抗氧化及提高机体免疫力等功效。丰岩乌骨鸡作为地方鸡种,更需要科学的养殖来促进当地经济的发展。所以本试验通过在日粮中添加茶树油,研究其对丰岩乌骨鸡雏鸡生长性能、免疫功能和肠道发育的影响,以期为茶树油在丰岩乌骨鸡日粮中的添加提供试验依据。本试验选用3日龄健康丰岩乌骨鸡1650只,随机分为5组。第一组为空白组,饲喂基础日粮;第二组为阳性组,在基础
Helmholtz方程是一个描述频域中波传播的偏微分方程。该方程在声学、电磁学和地震学等相关研究领域里有着广泛的应用。时谐情况下的声波传播,特定情况下的电磁波的散射,以及地震波扩散等过程在一定条件下都能够简化为该模型。因此Helmholtz方程的高效数值求解方法一直都是研究的热点。但是由于该模型具有一些特殊的性质,在对它进行模拟逼近时许多数值格式效果不佳。其主要原因是该模型往往建立在无界区域上,且
近年来,压缩感知(Compressed sensing)在信号处理、数学理论、统计学、计算机学科等领域得到了广泛关注。压缩感知中的稀疏信号重建是一类优化问题。原始-对偶牛顿优化算法是求解这类问题的一类重要方法。由于该方法需要用到二阶导数的信息,因此是二阶优化算法。二阶优化算法在收敛速度等许多方面具有优势,但也存在一个明显的缺点,即每步更新都需要求解一个线性方程组。本文利用循环矩阵构造了几种具有快速
自人工智能发展以来,深度学习算法特别是卷积神经网络CNN在计算、资源、功耗和成本均受限的嵌入式系统上的设计一直是一个比较热门的研究领域。CNN作为一种高性能的人工智能算法,可以广泛应用于人脸识别、行人检测和故障诊断等多个领域。它在嵌入式系统中的部署更是加速了这些应用的落地,使它们脱离服务器的束缚,真正服务于移动端和边缘端市场,具备很高的实用价值。CNN在嵌入式系统中的部署不仅涉及到了硬件设计更涉及
随着现实世界中数据量和数据结构复杂性的爆炸性增长,图数据在大范围应用中常被用于构建实体间的交互关系,其优越性也给人工智能、知识工程等领域带来重要的价值。作为高效管理和分析图数据的基础架构,图数据管理系统在工业和学术界都受到广泛关注。图数据管理系统主要有图数据库和图计算系统两类。近年来,涌现出越来越多具有突出性能表现的年轻图数据库和图计算系统。然而,目前图数据库和图计算系统领域内的系统性能评估工作大