【摘 要】
:
目标检测是计算机视觉领域中最基本且最具挑战性的问题之一,其目的是为了快速定位图像中某类或某些类的对象实例。随着遥感技术和探测器的不断发展,遥感目标检测也在城市交通管理、军事侦察等方面有着越来越广泛的应用。相较于SAR图像,光学遥感图像因其目标易识别、细节特征丰富、抗涂层干扰能力强等优点被广泛应用于目标定位与识别任务中。与此同时,受益于深度学习目标检测网络的飞速进步,目标检测器的性能得到了极大的提升
论文部分内容阅读
目标检测是计算机视觉领域中最基本且最具挑战性的问题之一,其目的是为了快速定位图像中某类或某些类的对象实例。随着遥感技术和探测器的不断发展,遥感目标检测也在城市交通管理、军事侦察等方面有着越来越广泛的应用。相较于SAR图像,光学遥感图像因其目标易识别、细节特征丰富、抗涂层干扰能力强等优点被广泛应用于目标定位与识别任务中。与此同时,受益于深度学习目标检测网络的飞速进步,目标检测器的性能得到了极大的提升。然而,在大型光学遥感图像中,由于小目标的纹理差异大、对比度低、方向任意密集分布和超细微等特性,使得检测小目标仍然具有挑战性。为了解决这些问题,本文重点研究了不同层级特征及旋转边界框对小目标检测性能的影响,通过对齐和融合卷积神经网络中浅层空间特征与深层语义特征来提升模型对小目标的识别能力,并在此基础上,引入旋转边界框缓解密集分布且方向任意的小目标漏检问题以及目标与候选区域特征不匹配的问题,从而提升光学遥感图像中小目标的检测性能,主要的工作总结如下:1、提出了一种基于特征偏移量的特征对齐策略,该方法通过改进骨干网络并引入特征对齐模块,来解决FPN因最近邻上采样而造成的相邻层级间特征未对齐的问题,利用核大小为3×3的卷积层预测特征偏移量,从而对齐两个相邻层级的特征图、匹配不同层级的语义与空间特征,该方法能在有效且无偏移地传递小目标深层语义信息的同时,抑制背景区域噪声,提升检测器对小目标的检测性能。2、设计了一种新的跃层连接策略,该方法将深层特征图通过跃层连接的方式与浅层特征图融合,使小目标的深层语义特征更有效地传递到浅层特征图中,并在深层特征图上添加权重系数来控制深层特征图传递给浅层特征图的信息,从而提升浅层特征图对小目标特征的学习能力,进一步增强检测器对小目标的识别能力。3、在此基础上,针对遥感图像中小目标任意方向且有可能密集分布的特性,引入旋转边界框区分小目标间的界限,利用级联的两阶段R-CNN网络和带约束的旋转候选框回归策略,降低旋转候选框的回归难度、提取旋转不变的区域特征并消除区域特征与目标之间的不匹配。为了更加有效地利用该网络的上述特性,引入通道注意力机制,抑制与小目标无关的背景噪声并突出小目标的特征,实验结果表明该方法能够在有效利用小目标特征的同时,降低复杂背景下任意方向密集分布的小目标的漏检率。
其他文献
近年来,由于计提巨额商誉减值导致上市公司业绩暴雷现象频繁发生,使得上市公司经营利润出现巨大亏损,引起了上市公司股价的大幅波动,对上市公司的长远发展造成了一定影响,基于此,本文认为研究商誉初始计量、后续计量以及对于管理层的监管十分重要。本文以汤臣倍健为研究对象,首先对汤臣倍健以及澳洲LSG双方的基本情况进行了介绍并了解其并购背景、巨额并购商誉的形成与减值计提过程,详细分析计提巨额商誉减值后的经济后果
随着物联网、云计算和移动支付等技术的快速发展,嵌入式系统在军事、汽车、医疗、通讯等领域得到广泛应用,尤其是众多嵌入式系统之间网络通讯、协同处理能力也得到进一步加强,这同时也给攻击者找到可趁之机。攻击者可以利用软件漏洞实施控制流攻击(Control Flow Attacks,CFA)进而对整个嵌入式系统进行控制。控制流攻击是指利用程序漏洞,通过篡改程序控制流的存储地址或控制流数据等方式,将程序导向并
随着集成电路(IC)的快速发展,IC的集成度不断增加,速度越来越快,功耗也在快速增加,集成电路优化设计变得越来越复杂。目前,集成电路优化设计主要是基于Boolean逻辑。但是大量研究表明,以Reed-Muller(RM)逻辑表示的电路在功耗、面积、速度和可测试性方面比传统Boolean逻辑表示的电路更有优势。固定极性RM(FPRM)展开式和混合极性RM(MPRM)展开式是两种常见的RM逻辑展开式。
人呼吸气中存在多种可用于癌症诊断的挥发性有机化合物(volatile organic compounds,VOC)气体,通过评估人体呼吸气中标志物VOC种类和含量的变化程度,可推断被测对象是否存在癌症隐患[1]。而传感器作为对信号传输、处理、存储、记录的主要检测装置,充分利用标志物的气敏特异性,设计高效检测癌症标志物的传感器,有望实现肿瘤的早期筛查和初步诊断。已报道的传感器普遍具有较好的灵敏度,对
随着信息处理量的需求不断提升,片上光互连网络的传输容量受到挑战,以光信号作为载体的多维复用技术开始崭露头角。其中,偏振分束器能够将光信号加在到正交偏振态上进行低串扰传输和分离,是偏振复用技术中的核心器件。而硅基光电子器件因兼容于CMOS工艺且在通信波段几乎无损透明因而受到广泛关注。鉴此,本文将从光子集成角度考虑,着重对片上集成型偏振分束器进行研究,其主要内容与创新之处如下所述:1、基于超表面辅助Y
随着工业自动化与智能化的发展,工业机器人被广泛应用于工业生产加工的各个环节,而在工件加工、分拣等过程中,首先就需要对工件种类进行识别。目前工业机器人中大多使用基于模板匹配等传统视觉算法来完成工件识别任务。随着工件结构越来越复杂,传统识别方法已经难以满足识别需求。本文中针对传统算法通用性较差以及其对工件位姿变化、环境噪声等因素鲁棒性较差等问题,分别采用基于RGB-D图像的深度学习算法和基于多视图的深
半导体金属氧化物气体传感器可以利用半导体材料与被检测气体的氧化还原反应引起材料的电阻发生改变,从而实现在环境监控、安全警报、室内环境以及疾病诊断等多个领域的应用,为解决空气污染和挥发性有机化合物(VOCs)气体的检测提供了一种有效的途径。然而,半导体金属氧化物气敏传感器目前仍然存在着一些弊端,如单一的传感器材料因具有较差的比表面积和孔隙度,所制备的传感器的稳定性及对所检测气体的选择性不够理性,导致
红外成像探测制导系统在高超音速飞行器的环境感知系统中扮演着十分重要的角色。截止目前,飞行器壁面及光学窗口与高速来流的强相互作用而导致的气动光学效应仍是制约红外成像探测系统在高超音速飞行器上应用的主要因素,风洞实验和计算机仿真是研究该问题的普遍思路。由于风洞实验存在效率低、成本高及实验样本不足等问题。通过建立合理的计算机仿真模型,可快速为气动光学效应的研究提供大量数据支撑,从而极大地降低研究成本。为
随着人们对多媒体应用需求的增长,越来越多的显示设备出现在市场上,如立体显示设备(3DTV)和头戴式显示设备(HMD)。由于内容生成与终端显示层面上的分离,因此对特定格式的显示内容进行适配是一项重要的研究。此外,内容捕获、编码和传输过程会出现内容质量退化和失真,以用户观看体验为基础的视觉质量评价也受到了人们的广泛关注。本文面向3DTV和HMD两种显示设备,提出了3D立体图像显示优化方法和全景视频质量
硫系光纤由于其在中远红外具有优良的宽谱透过、极高的非线性等特性,在光纤传感、红外成像、光纤激光器领域等具有非常广泛的应用。目前,最宽的超连续谱光源的产生就报道于硫系光纤,但受其本身材料的功率阈值限制,难以产生较高的能量输出。多芯光纤具有相比于单芯光纤更大的模场面积,从而能够增加输入功率。同时,多芯光纤中诸如布里渊散射等非线性效应的阈值可以有效降低。本文通过将硫系光纤与多芯光纤结构相结合,基于Ge-