图像识别中的不平衡学习和增量学习方法研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:kaishizai2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像识别是计算机视觉领域最为基础的任务。基于深度卷积神经网络(Deep Convolutional Neural Network,DCNN)的图像识别方法是目前的主流方法,取得了远超传统方法的性能。大多数基于DCNN的图像识别方法依赖于静态环境,并且需要规模庞大且类别分布均衡的训练数据。但在实际场景中,数据分布往往不平衡,数据规模在持续增长,新类别不断涌现,给图像识别带来了巨大挑战。在面对数据不平衡时,若采用通用的算法进行训练,DCNN在预测时将偏向于多数类,并且在少数类上易于发生过拟合,性能欠佳。数据不平衡通常伴随着数据复杂性,即数据通常具有类间相似度高,类内差异大的特点,进一步影响了模型的性能。面对数据增长问题时,因新知识的学习和新旧类别的数据不平衡,增量学习模型在旧数据上的性能将会下降,即灾难性遗忘。针对上述挑战,本文基于深度卷积神经网络强大的表示能力,从对特征学习进行校正与约束的角度开展了研究,并设计了相应的图像识别方法。本文的主要工作如下:(1)为减少数据不平衡及其复杂性的影响,设计了一种基于协方差判别损失的图像识别方法。该方法利用考虑了一阶和二阶距离的协方差判别损失,给难样本的特征学习提供了更多约束,实现了少数类和多数类的深度特征的有效分离。本文给出了相应的难样本挖掘算法,进而可筛选相应的错分样本或具有不合适特征表示的样本。通过在ISIC2018皮肤损伤数据集和不平衡FGVC-Aircrafts数据集上的实验,证实了本文设计的方法能有效校正少数类的深度特征和处理不平衡数据分类问题。(2)从考虑数据内部结构的角度出发,本文设计了一种基于聚类度量损失的图像识别方法,以更好地处理数据不平衡及其复杂性。该方法首先采用k-means方法挖掘聚类结构,然后利用交叉熵损失和聚类度量损失进行联合优化,进而增强了特征学习和分类能力。所设计的聚类度量损失通过对聚类距离、类内距离与类间距离的关系进行约束,实现深度特征的有效校正,保证了类别之间的间隔。本文在不平衡Stanford Dogs数据集和不平衡Describable Textures数据集上进行了对比实验,表明本文设计的方法一致优于对比方法;与此同时,通过消融实验证实了所设计的损失函数每一项的有效性。(3)针对新知识的学习和新旧类别的数据不平衡导致的灾难性遗忘,本文将基于模型的方法嵌入到基于存储的方法,提出一种基于样例特征学习的多类别增量学习方法。首先,本文利用基于模型的Memory Aware Synapses(MAS)模块计算参数重要度,并以此来减轻权重漂移,并保持旧数据特征的可分性。与以往增量学习方法不同的是,本文对图像尺寸进行预处理,利用预训练网络进行参数初始化,减少了训练次数,进一步减轻了模型变化。其次,利用Exemplar-Based Subspace Clustering模块进行样例挖掘,保证了样例的充分性和多样性。最后,在合适的条件下,本文采用非参数的多中心最近邻类均值分类器替代MAS模块的全连接层,来降低训练次数,并减轻新旧类别的数据不平衡的影响。本文通过进行消融实验和对比实验,表明基于样例特征学习的多类别增量学习方法方法表现良好,并显著优于对比方法。(4)提出一种基于双分支深度最近邻类均值分类器的多类别增量学习方法。在样例特征学习的方法中,特征提取器和分类器是分别获得的,二者的匹配度不高。为此,本文提出了一种基于联合训练的方法——双分支深度最近邻类均值分类器,以更好地降低灾难性遗忘的影响。首先,该方法采用集成学习的方式对原始分支和再平衡分支进行训练,降低了新旧类别的数据不平衡的影响。其次,利用激活迁移损失函数来减少特征层面的灾难性遗忘,进而保持特征对于旧类别数据的可分性。最后,采用具有天然优势的最近邻类均值分类器进行预测,并实现了特征提取模块和分类器的联合训练,提升了两者的匹配度。对比实验表明双分支深度最近邻类均值分类器在新旧类别上具有良好的分类性能,而消融实验则验证了双分支结构、联合训练、激活迁移损失等模块的重要性和必要性。
其他文献
三阴性乳腺癌(Triple negative breast cancer,TNBC)是恶性程度较高的乳腺癌亚型之一,高发于年轻女性,转移常见且预后较差。目前,TNBC治疗多以化疗为主。近年研究发现肿瘤相关巨噬细胞(Tumor-associadted macrophages,TAMs)在TNBC的发生发展、治疗评价中发挥重要作用.基于TAMs的治疗与预后评价策略已成为当下TNBC的研究热点。本文就T
期刊
超支化聚合物是一种具有低黏度、多反应活性官能团的材料,因其独特的结构和性质而备受关注,聚氨酯(PU)因其优越的性能而得到广泛应用。超支化聚氨酯(HBPU)综合了超支化聚合物独特的结构和聚氨酯优异的性能,是近年来高分子材料领域的研究热点。介绍了不同主链结构和末端官能团数量的超支化多元醇,并利用红外光谱、GPC等仪器对核心原材料超支化多元醇进行表征,随后通过与异氰酸酯、功能性助剂等的化学聚合反应制备得
目的 总结人类表皮生长因子受体2(HER2)基因表达与HER2阳性乳腺癌靶向治疗效果的关系并总结HER2基因拷贝数相关研究的新进展。方法 复习近年来关于HER2阳性乳腺癌与相关靶向治疗的文献并进行综述。结果 HER2基因拷贝数和HER2/CEP17比值与HER2阳性乳腺癌预后有关,且循环肿瘤DNA测序有望成为靶向治疗效果的预测指标。结论 较高的HER2基因拷贝数可能与较好的HER2阳性乳腺癌预后相
合成孔径雷达(SAR)成像技术具有全天时、全天候、分辨率高、探测距离远、穿透云雾植被等优势,是一种先进的雷达信息获取方式,具有重要的军事和民用价值。而SAR图像的特征会随着不同的配置条件发生明显的变化,使得SAR图像的目标识别任务不像光学图像那样容易。此外,随着SAR成像技术的发展,雷达图像所包含的数据量越来越大,给SAR图像的解译增加了难度。如何识别雷达图像中的物体并对目标进行分类是雷达图像解译
基于受激布里渊散射(Stimulated Brillouin Scattering,SBS)的分布式光纤传感技术可实现光纤沿线温度、应变、振动等物理参量检测而广泛应用于大型基础设施结构健康、军事边境安防、深海空天开发等监测领域,长距离精准定位和高精度实时测量的应用需求日趋迫切。然而,传统光时域分析(Brillouin Optical Time Domain Analysis,BOTDA)技术采用脉
畜牧业作为农业的重要组成部分,在国民经济发展中的基础地位不可动摇。综合考量养殖环境、品质及效率等因素,生猪集约化养殖意义重大。目前,现代集约化养猪场已经逐步实现无人值守,对无人值守养猪场中生猪异常行为进行智能监测,是实现安全养殖、高品质养殖和高效养殖的现实需求。本论文运用机器视觉技术、声音识别技术和超声波技术三种监测手段,从多角度对生猪异常行为进行数字化综合监测,最后采用多源信息融合方法对生猪多源
拉曼分布式光纤传感技术可实现温度的大范围高精度监测,在桥梁隧道、油气管线、智能电网等大型基础设施结构健康监测领域具有重大社会需求和应用前景。然而,拉曼分布式光纤传感系统其传感信号为强度极弱的自发拉曼散射信号,且传感光缆多铺设于光纤损耗较大的野外恶劣环境,存在信噪比(Signal-to-noiseratio,SNR)较低的技术瓶颈。增加探测脉冲宽度可提高系统SNR,进而提高系统测温精度和温度分辨率,
随着LoRa、NB-IoT以及5G等通信技术的发展,物联网设备数量与日俱增,物联网安全也日益成为物联网应用关注的热点。物联网设备识别是物联网设备安全评估、防护和升级的必备前提,设备识别的目标是确定设备的类型、品牌、型号和固件版本等属性信息,尤其是细粒度的设备型号和固件版本信息,与设备漏洞直接关联,能够更准确的反映出设备的安全状态。然而面对物联网设备数量庞大、品牌类型繁多以及服务协议混杂等现实存在的
随着位置感知设备及技术的发展、基于位置的应用的盛行,空间文本数据——同时包含空间和文本属性的数据,也称作空间文本对象(简称对象),正以空前的速度和规模产生。空间文本查询(Spatial-Textual Queries,STQ)是在空间文本对象集上,检索满足查询空间文本约束条件的、高精度的结果集,是基于位置服务的高频关键操作。STQ的求解以及优化是空间数据管理研究领域的一个主要方向。空间文本索引和数