【摘 要】
:
近年来,受益于深度学习技术的快速发展,监督分类方法取得了长足的进步。然而,监督分类方法有非常大的弊端,就是需要大量人工标注的训练数据,需要耗费大量的人力成本,并且学习的模型无法有效迁移到没有标注图像的场景下。零样本分类(也被称为零样本学习)的提出,则有效解决了上述问题,其旨在让模型具有识别从未见过的数据类别的能力。目前对于零样本分类的研究中仍存在很多不足,对于零样本分类中的细粒度图像分类,由于细粒
【基金项目】
:
国家自然科学基金创新研究群体基金(61836009,61621005); 国家自然科学基金重大研究计划(91438201、91438103、61801124); 国家自然科学基金(U1701267、61871310、61902298、61573267、61906150); 教育部111
论文部分内容阅读
近年来,受益于深度学习技术的快速发展,监督分类方法取得了长足的进步。然而,监督分类方法有非常大的弊端,就是需要大量人工标注的训练数据,需要耗费大量的人力成本,并且学习的模型无法有效迁移到没有标注图像的场景下。零样本分类(也被称为零样本学习)的提出,则有效解决了上述问题,其旨在让模型具有识别从未见过的数据类别的能力。目前对于零样本分类的研究中仍存在很多不足,对于零样本分类中的细粒度图像分类,由于细粒度图像具有“类内差异大,类间差异小”的特点,使其标注和分类都非常困难。为了解决上述问题,本文利用生成式对抗网络(Generative Adversarial Network,GAN)作为核心技术,并在此基础上做一系列的改进,对零样本细粒度图像分类进行研究。研究中为了增大输入生成器的未见类文本特征中有用信息的比例而减小无用信息的比例,从而提高零样本细粒度图像分类的准确率,本文做了如下几项工作:(1)提出了一种基于注意力生成式对抗网络的零样本细粒度图像分类的方法,将未见类的有噪声的文本特征作为输入,在生成器中使用注意力机制,通过网络的不断学习对文本特征向量进行重标定,加强对文本特征的有用信息的关注,而忽略文本特征的无用信息,从而提高零样本细粒度图像分类的准确率。该方法与14种对比算法相比具有竞争力。其相比于基础算法GAZSL,本方法利用SCS和SCE两种数据分割方法在CUB数据集上分别提高了0.96和1.16个百分点,在NAB数据集上分别提高了4.2和0.38个百分点;相比于近年来新出的6种先进算法,本方法利用SCE数据分割方法在CUB数据集上的分类结果是最优的。(2)提出了一种基于多尺度生成式对抗网络的零样本细粒度图像分类的方法,根据多尺度模型原理,在生成器中加载多尺度降维结构,对输入生成器中的文本特征向量进行多尺度的降噪处理,即降维操作,之后再充分地融合不同尺度的文本特征,该融合文本特征拥有比例更大且更丰富的有效特征,而且含有比例较小的噪声,从而提高零样本细粒度图像分类的准确率。该方法与14种对比算法相比具有竞争力。其相比于基础算法GAZSL,本方法利用SCS和SCE两种数据分割方法在CUB数据集上分别提高了1.44和1.83个百分点,在NAB数据集上分别提高了3.87和0.63个百分点。(3)提出了一种基于注意力多尺度生成式对抗网络的零样本细粒度图像分类的方法,在生成器中对多尺度降维后的文本特征分别使用注意力机制,综合了注意力机制与多尺度降维结构的优势,更加有效地提高了零样本细粒度图像分类的准确率。该方法与14种对比算法相比具有竞争力。其相比于基础算法GAZSL,本方法利用SCS和SCE两种数据分割方法在CUB数据集上分别提高了1.48和2.47个百分点,在NAB数据集上分别提高了4.17和0.67个百分点;相比于近年来新出的6种先进算法,本方法利用SCE数据分割方法在CUB数据集上的分类结果是最优的。综上所述,本文针对零样本分类中的细粒度图像分类这一难题,进行了系统的研究。本文主体利用生成式对抗网络的方法,在其基础上验证了使用注意力机制、多尺度降维结构以及两者的结合结构的有效性,并进一步提出了基于注意力多尺度生成式对抗网络的零样本细粒度图像分类的方法。实验表明,本文的三种方法利用SCS和SCE两种数据分割方法,在CUB、NAB数据集上均取得了较好的结果,证明了本文所提方法的有效性和可行性。
其他文献
低密度奇偶校验(Low Density Parity Check,LDPC)码是一种由Gallager在1962年提出的具有高效率和高性能的纠错码。当时受到软硬件设备条件的限制,该码并没有被广泛运用,直到上世纪90年代才被学者重新提出。非二元LDPC码凭借其更稀疏的Tanner图以及更长的围长表现出更强的纠错能力,被应用在无线通信和光纤通信的研究中,成为近年来纠错码领域的研究热点之一。符号翻转译码
在我国经济快速发展的背景下,大数据已在大众生活生产等各方面得到了广泛应用,这同时也为各领域的智能化发展提供了保障。目前,我国道路交通步入了新的发展时期,实现智能化已经成为最为迫切的任务。为确保经济的快速发展、居民的生活水平提升,各级政府在道路交通管理方面投入了大量的人力物力,不断对道路安全管理模式进行升级和创新,尤其是交管部门加深了大数据技术的应用,为城市交通管理实现智能化提供了有力支撑。在城市化
近年来,随着社会的发展和科技的进步,信息技术日新月异,云计算技术也日益革新。云计算作为并行计算、分布式计算、效用计算、网络存储、虚拟化、负载均衡等传统计算机技术和网络发展融合的产物,受到了各行各业的广泛的关注。越来越多的企业及个人用户选择云服务器来满足日常工作以及业务需求。目前,大多数个人用户和小型企业用户会选择公有云服务,公有云服务平台可以方便快捷地获取云平台的监控数据,方便用户检查和管理,但是
在机械设备从开始投入使用,经历实际工况下的不断磨损消耗,到最终失去使用价值而报废的全寿命周期中,维修保障工作的实施对设备的正常使用具有极大的影响。维修手册作为指导维修人员准确完成设备维修工作的技术资料,是机械设备配套的必备交付物。传统的纸型维修手册由于查询效率低、维护成本高等问题已经不能满足现代机械设备的信息化高速发展要求,而目前普遍使用的电子维修手册虽然依靠数字化的优势在很大程度上解决了纸型手册
随着无线通信技术的迅速发展,用户对通信质量要求越来越高,大带宽、高速率、多用户、低成本等需求不断被提出。为了满足上述需求,第五代移动通信技术(5G)新空口(NR)在网络架构、帧结构和信道编码等方面引入了全新的设计,因此NR信号的检测也产生了很大不同。超密集组网(UDN)网络架构是NR为了提升网络容量所采取的小区密集化的部署方案,即覆盖范围有限的小型小区的超密集部署。该场景下,同频段内密集分布的多个
目标检测与跟踪作为计算机视觉领域的一个重要分支,在智能交通、安防监控等领域具有广泛应用。目前主流的目标检测与目标跟踪算法虽然具有较高的精度,但对于计算能力相对较低的嵌入式平台,其实时性还不够强。本文主要从目标检测跟踪算法的改进和嵌入式平台的算法移植两个方面展开研究,具体内容如下:(1)本文首先对系统的总体方案进行了规划:在硬件平台方面,本文选取ARM+FPGA架构的SOC(System on Ch
TTE时间触发以太网是一种可以应用于轨道交通、高端工业控制等领域的实时确定性以太网,其具有实时确定和安全容错的通信能力,为增强使用TTE的网络系统的可靠性与错误可溯源性,可以将TT业务的数据备份至大容量存储设备内。NAND Flash作为一种非易失性存储(Non-Volatile Memory)即NVM,其拥有易于大容量集成、耐震动耐撞击、成本较低等优点,在固态存储领域被广泛使用。对NAND Fl
随着城市化进程的不断加快,消防管理水平与消防安全需求不匹配的矛盾日益突出。科技的发展为解决这一难题提供了新的思路和策略。一些企业积极探索,将物联网技术运用于消防管理中,通过智能化的技术手段对建筑消防设施进行监测维护,并提供线上巡检工具,在一定程度上帮助社会单位提升了消防安全管理水平。本文以消防设施物联网系统运行平台中的数据传输标准建设为导向,浅析消防设施物联网系统的组成和体系架构,并结合标准研究过
随着人类科技文明的进步和计算机硬件等水平的提升,图像处理技术得到了飞速发展。人类社会每天都会产生大量的高质量数字图像,但是在图像采集和传输过程中,由于设备故障、噪声污染或者天气气候等恶劣因素的影响,获取到的数字图像往往会出现质量退化的现象,即不能直接得到清晰的原始图像信息。那么,如何从这些质量退化的数字图像中精确地恢复出原始数字图像是学者们一直在探索研究的课题。本文的研究内容主要针对人类日常生活中
用矩量法分析天线辐射问题一直以来都是电磁分析中的重点问题。其中,集总激励源以其清晰明了的定义形式、易加载、易实现等优点,成为矩量法中主要的天线激励源之一。然而,用集总激励源求解含有波端口结构的天线时,天线输入阻抗结果会出现频偏,和波端口结果有一定的差别。针对上述问题,本文利用矩阵束方法提高集总激励源的求解精度,并用反射系数法对不同场景中的天线辐射问题进行了分析和求解。首先,本文详细的介绍了电磁问题