基于特征传播与融合的视频目标检测研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:randygu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测对物体进行识别和定位,在视频监控、智能机器人、自动驾驶等视觉应用系统中承担着对场景进行基础建模的重要作用。由于深度学习的引入,基于静态图像的目标检测算法有了性能上的大幅进步。然而,在实际的应用场景中,视觉系统的输入通常是连续的视频,而不是独立的图像。直接将静态图像目标检测算法应用于视频的每一帧,会出现以下问题:(1)视频图像质量往往会由于运动模糊、尺度变化、目标遮挡等原因出现较为明显的下降,单帧图像无法提供目标的准确信息;(2)视觉系统要求实时性,对每一帧都进行特征计算,算法运行速度无法达到要求;(3)视频图像具有时空一致性,每帧独立检测没有充分利用时序信息。本论文研究基于特征传播与融合的视频目标检测算法。其中,特征融合模块通过建模目标的时空关系,提升了算法的检测精度;特征传播模块通过利用相邻图像的冗余性,提升了算法的检测速度。本论文的主要工作内容和创新性成果包括以下三个方面:1.提出了一种基于循环神经网络的视频目标检测算法。循环神经网络具有记忆保留功能,可以提取视频的时序信息。本算法对传统的循环神经单元进行改进,用于图像帧间的特征传递与聚合,完善当前帧的特征表达。为了减轻运动偏移对聚合模块带来的影响,本算法利用光流进行图像帧间的特征对齐,光流计算融入到网络中,算法框架保持端到端结构。本算法符合因果性的实际系统要求,即在检测当前帧时,不利用将来的信息。在公开数据集Image Net VID上的实验表明,本算法有效提升了视频目标检测的精度,即使与非因果性的各种算法相比,也能达到更优或者相近的性能。2.提出了一种基于自注意力机制的视频目标检测算法。针对循环神经网络的短距离依赖性,本算法利用自注意力机制代替循环神经网络构建特征聚合模块。自注意力机制对近程和远程信息都具有直接的捕获能力,同时可以增加计算的并行性。本算法直接基于感兴趣区域进行特征聚合,一方面建模了目标之间的关系,另一方面避免了基于光流的特征对齐操作。为了充分挖掘视频全局信息,本算法对输入视频事先进行打乱,使得每一帧图像都可以获得若干的随机辅助帧。在公开数据集Image Net VID上的实验表明,本算法相较其他现有算法,具有更优的精度性能。3.提出一种基于关键帧策略的快速视频目标检测算法。密集的特征计算和聚合虽然显著地提升了检测精度,但是损失了运行速度。本算法引入了关键帧的策略,提出了一种新的视频目标检测框架,即关键帧进行特征的计算和聚合,而非关键帧进行特征的传播,实现精度和速度的平衡。其中,关键帧到非关键帧的特征传播由基于光流的传播模块完成。关键帧之间的聚合可以由基于改进循环神经网络的聚合模块完成,也可以由基于二维自注意力机制的聚合模块完成。在公开数据集Image Net VID上的实验表明,本算法在明显提升检测速度的同时,也能获得比逐帧检测的方法更优的精度。
其他文献
近年来,智能移动机器人、无人驾驶、增强现实(AR,Augmented Reality)与虚拟现实(VR,Virtual Reality)等新兴技术在国内外备受关注,在强劲的市场与应用需求以及巨大的商业潜能
暖通空调设备的节能高效运行是长期的研究目标。热泵空调系统将低品位热源转化为高品位热能,广泛应用于工程实际,从设计生产到长期运行各个阶段都会产生大量的数据。本文应用
随着信息技术的快速发展,多模态话语分析在西方开始出现,话语意义得到进一步解释。国外学者认为话语或语篇就是一个语义单位,意义不仅仅能通过语言实现,也可以通过其他符号系
石英毛细管结构简单、成本低且具有天然的空芯圆对称结构,因此易于与光纤集成形成各种级联结构,是实现光纤传感器的重要载体。基于石英毛细管的传感器件主要包含法珀(Fabry-P
目标检测是计算机视觉领域中的重要基础研究,是图像内容理解问题的重要基础。随着机器视觉技术的深入研究,通过各种智能算法对图像中的目标进行准确识别和精确定位。但是在雾
申威系列处理器是采用自主指令集且具有完全自主知识产权的国产通用处理器,已经成功应用在超级计算机、高性能服务器、存储系统、网络安全等多个领域。LLVM作为开源编译框架
伴着控制技术的不断进步,轮式移动机器人越来越多地应用于智能交通、家居服务、工业生产等领域。近几年,视觉传感器凭借其低成本和获取图像信息无需接触测量等特点,与智能化
电阻点焊作为一种重要的焊接方法,广泛应用于航空航天、汽车、五金、电子及医疗器械等多个领域。近年来,随着器件、设备的小型化,微型零件的电阻点焊的应用越来越多。微型零
政党制度是一个国家各政党参与政权的制度性规范,体现了各政党在国家政权与社会结构中的地位作用、相互关系、运作方式、实现形式等。改革开放以来,关于政党制度理论的研究日益兴盛。随着政治、经济、社会环境的变迁,特别是政党、政府及社会关系的变化,关于政党制度概念内涵的界定在不同时期也有所不同,代表性观点有“体制说”“制度说”“综合说”等。探究政党制度概念内涵的理论逻辑,理清概念发展的历史脉络和实践效果,有助于在国内外政党制度的实际对比中,凸现中国政党制度的鲜明特色和显著优势。
红外成像系统依据目标物体自身发出的热辐射信息成像,使所获取的红外图像能够显示出具有高热辐射量的场景信息,而低热辐射量的场景信息会在背景热辐射中湮灭。近年来,红外成