无监督领域自适应目标检测方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:Luke_ibox
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉、人工智能等领域的重点研究方向之一。该方向的主要任务是对图像中多个感兴趣的目标进行定位和识别。目标检测技术的研究成果广泛应用于行人检测、人脸识别、遥感检测和车辆检测等领域。传统的目标检测方法总是假设训练数据和测试数据遵循相同的分布,但现实生活中很难满足这种假设,因为训练数据和测试数据通常是在不同的环境中进行收集的。为此,领域自适应目标检测方法被提出用来解决分布不一致场景下的目标检测问题。然而,另一个现实问题是,由于数据隐私性和数据传输等问题,很多情况下源域模型在完成训练后便无法访问源域数据。针对这两种情况,本文对无监督领域自适应目标检测的有源及无源两个问题进行研究。对有源问题而言,本文分别从源域数据是单源数据还是多源数据这两个角度展开研究工作。在单源的情况下,主要研究如何保证在特征空间自适应过程中语义的一致性及如何处理具有不同迁移性的图片及图片上的目标来避免“负迁移”。在多源的情况下,研究如何充分利用多个源域的知识及如何将多个知识进行融合来提高检测模型对目标域的检测准确度。对无源问题而言,本文主要研究如何在只有源域训练好的模型而无法访问源域数据的场景下利用模型内隐含的风格信息和知识蒸馏的框架进行领域自适应。本文的主要工作及贡献总结如下:(1)为解决单源领域自适应目标检测在域自适应过程中丢失语义信息的问题,本文提出了循环一致性域自适应目标检测方法。首先,将源域的特征转换到目标域,并对齐转换后的源域特征和目标域特征。同时目标域的特征也经过类似操作。然后,优化循环一致性损失来保证样式在转换过程中两个域之间的语义一致性。最后,使源域特征等价于源域生成器输出的源域重构特征,并对目标域特征也进行同样重构操作,来优化源域和目标域的生成器。实验表明,该方法通过对齐转换后的源域特征和目标域特征及源域特征和转换后的目标域特征,能够有效地保留在域自适应过程中的语义信息。(2)为解决单源领域自适应目标检测直接对齐源域和目标域的图片和目标造成的“负迁移”问题,本文提出了基于注意力机制的局部和全局的领域自适应目标检测方法。首先,提出全局的注意力机制来突出和加权可迁移的图片,用来缓解由于直接全局对齐不当造成的“负迁移”。然后,在包含像素,纹理等信息的浅层特征空间中实现两个域之间的强匹配,在未破坏语义信息的条件下缩小了跨域差异。最后,对于较大域差异的图像,利用注意力机制将更多的注意力集中在目标上同时忽略背景信息,来提高模型的性能。实验表明,该方法通过有区别地对待具有不同迁移性的图片和目标来改进域自适应过程,有效地缓解了领域自适应目标检测的“负迁移”问题。(3)为充分利用多源领域自适应目标检测中多个源域知识来提高目标检测模型对目标域的检测性能,本文提出了基于多个源域知识迁移的领域自适应目标检测方法。首先,通过学习浅层特征提取网络对多个域的浅层特征进行对齐,来缩小源域跟目标域的分布差异。然后,利用后续的多个分支网络对每一对源域和目标域的高层特征进行对齐,来度量每个源域到目标域的迁移性,并在测试时,基于这个迁移性来融合多个分支网络输出的目标样本特征。最后,利用图像级和实例级的注意力来促进“正向”跨域迁移和抑制“负迁移”。实验表明,多源域自适应不仅能提高模型的鲁棒性,还能充分利用多个源域知识来提升目标域模型的检测性能。(4)为解决在无源领域自适应目标检测中只有源域训练好的模型而没有源域数据的域自适应问题,本文提出了基于源域风格迁移蒸馏网络方法。首先,利用预训练源模型中的批归一化信息将目标域特征转换为类源风格特征。然后,利用Mean Teacher网络模型的一致性正则化进一步将知识从源域蒸馏到目标域。最后,通过添加与目标域分布相关的扰动,来增加领域特定信息的鲁棒性。实验表明,充分利用预训练源模型的批归一化信息,能够有效地将源域的知识迁移到目标域中。综上所述,本文通过对无监督领域自适应目标检测任务的多个问题面临的技术瓶颈进行深入分析,从解决不同问题的角度出发,分别在自适应过程中保留语义信息、自动和动态地加权可迁移性的图片和目标、提出了多源领域自适应知识迁移方法、基于批归一化的源域风格迁移等方法的研究,有利于无监督领域自适应目标检测领域的发展,具有一定的理论价值和应用价值。
其他文献
合成孔径雷达(Synthetic Aperture Radar,SAR)是主要的对地侦察手段之一,但是传统的单基SAR收发同站,易受电磁干扰,因此如何提升SAR抗干扰能力成为当前研究热点。与单基SAR相比,多基SAR不仅能获得更加丰富的目标散射信息,还具有构型灵活等优势,为抗干扰研究提供了更多的可能,成为了SAR抗干扰技术研究的国际前沿问题。本文围绕多基SAR抗欺骗干扰问题开展研究,重点突破了多基
本文概述了云计算,之后对云计算常见的体系结构和边缘云计算的体系结构进行分类分析,最后对云计算系统和边缘云计算系统的数据迁移方法策略进行分析,希望对我国边缘云计算系统的推广使用提供一定帮助。
基于深度学习的伪装目标检测是一项新兴的视觉检测任务,其目的是精确且高效地检测出“完美”嵌入周围环境中的伪装目标。目前大多数工作旨在构建不同的伪装目标检测模型,对现有模型的归纳总结及深入分析的综述性工作还很少。因此,对基于深度学习的伪装目标检测模型进行了全面分析和总结,并探讨了伪装目标检测未来的研究方向。首先对基于深度学习的23个伪装目标检测模型分别从由粗到细策略、多任务学习策略、置信感知学习策略、
基于深度学习的目标检测技术已广泛应用于移动支付,自动驾驶和安全保护等许多领域,但是在实际电力安全作业检测、高空无人机垃圾检测和震灾房屋损坏检测等应用中仍然存在许多挑战:如小目标检测,遮挡目标检测和应用的实时需求。针对以上问题,本文研究分析多尺度深度特征融合信息使骨干网络提取的不同特征层之间进行信息传递过程,从而获得包含不同尺度层的目标空间位置特征以增加预测目标位置和类别的语义信息。使用有限的相邻特
对未知小天体准确的环境感知是探测器安全软着陆的先决条件。随着人工智能与多源数据融合技术的快速发展,智能化的小天体探测器将具有更为强大的环境感知能力与适应能力。为了克服当前单一观测手段存在感知视野受限、场景适应性及抗光照能力差等问题,本文采用相机与激光雷达作为信息观测源,对多源数据融合的小天体环境智能感知算法进行深入研究。论文主要研究内容如下:首先,对基于光学图像的小天体表面地形特征智能检测算法进行
本文阐述了“互联网+”技术结合知识图谱模式挖掘档案信息的深层关系,提出了知识服务时代档案建设的实施策略,旨在充分发挥信息化技术带来的优势,为档案建设的创新性发展提供理论参考。
<正>改革开放四十余年,建筑行业已经成为国民经济支柱产业,人们对工作、生活和居住环境的要求也在不断提升。“十四五”期间,中央和地方各级政府陆续出台了关于智慧社区、智慧园区和智慧城市的引导和扶持政策,推动、加快政府和各行各业向数字化全面转型。智慧建筑是构成智慧社区、智慧园区和智慧城市的基本细胞,如何通过智慧建筑的设计营造符合时代发展的绿色、舒适、高效、安全、智慧的人居环境,是每一个建筑智能化从业者需
期刊
随着刑事合规改革的推进,单位犯罪不起诉制度作为合规激励措施重新走入大众视野,检察机关先后开展两期刑事合规试点工作并出台系列文件、方案指导单位合规,在改革试点地区,出现了以刑事合规为基础对涉罪单位作出不起诉决定的做法,并形成了“检察建议+不起诉模式”与“合规考察+不起诉模式”两项改革成果。“检察建议+不起模式”是在考察涉罪单位刑事合规意愿基础上,对涉罪单位进行酌定不起诉,并发出刑事合规的检察建议。“
三维车辆检测是车辆自动驾驶过程中的基础和核心任务,对于保证行车安全十分重要。近几年,随着深度学习理论和传感技术的快速发展,三维车辆检测方法的检测性能得到了极大的提升,然而距离其在实际交通场景中应用还面临两方面的挑战,首先是检测方法的检测精度还无法满足自动驾驶的需求,主要体现在遮挡及远距离车辆目标的漏检率和形似车辆目标的误检率还较高;其次是现有的检测方法也不能很好地满足全天候场景检测的需求,各检测方
<正>感悟努力成为居民的朋友和伙伴,伴随着街区和社区一点一滴的更新发展,希望处处都有微花园。《北京城市总体规划(2016年-2035年)》和《首都功能核心区控制性详细规划(街区层面)(2018年-2035年)》中提出了“开展留白增绿、补齐短板、改善环境、提升品质的城市修补工作”和“推动老城整体保护与复兴,完善绿地体系,开展绿化美化建设,让街巷胡同成为有绿荫处、有鸟鸣声、舒适的公共空间”等指导意见~
期刊