基于特征传播与融合的视频目标检测研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户：randygu

【摘要】

：

目标检测对物体进行识别和定位,在视频监控、智能机器人、自动驾驶等视觉应用系统中承担着对场景进行基础建模的重要作用。由于深度学习的引入,基于静态图像的目标检测算法有

【作者】

：

王亦菲

【出处】

：

浙江大学

【发表日期】

：

2004年期

【关键词】

：

视频目标检测特征传播与融合循环神经网络自注意力机制光流

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目标检测对物体进行识别和定位,在视频监控、智能机器人、自动驾驶等视觉应用系统中承担着对场景进行基础建模的重要作用。由于深度学习的引入,基于静态图像的目标检测算法有了性能上的大幅进步。然而,在实际的应用场景中,视觉系统的输入通常是连续的视频,而不是独立的图像。直接将静态图像目标检测算法应用于视频的每一帧,会出现以下问题:(1)视频图像质量往往会由于运动模糊、尺度变化、目标遮挡等原因出现较为明显的下降,单帧图像无法提供目标的准确信息;(2)视觉系统要求实时性,对每一帧都进行特征计算,算法运行速度无法达到要求;(3)视频图像具有时空一致性,每帧独立检测没有充分利用时序信息。本论文研究基于特征传播与融合的视频目标检测算法。其中,特征融合模块通过建模目标的时空关系,提升了算法的检测精度;特征传播模块通过利用相邻图像的冗余性,提升了算法的检测速度。本论文的主要工作内容和创新性成果包括以下三个方面:1.提出了一种基于循环神经网络的视频目标检测算法。循环神经网络具有记忆保留功能,可以提取视频的时序信息。本算法对传统的循环神经单元进行改进,用于图像帧间的特征传递与聚合,完善当前帧的特征表达。为了减轻运动偏移对聚合模块带来的影响,本算法利用光流进行图像帧间的特征对齐,光流计算融入到网络中,算法框架保持端到端结构。本算法符合因果性的实际系统要求,即在检测当前帧时,不利用将来的信息。在公开数据集Image Net VID上的实验表明,本算法有效提升了视频目标检测的精度,即使与非因果性的各种算法相比,也能达到更优或者相近的性能。2.提出了一种基于自注意力机制的视频目标检测算法。针对循环神经网络的短距离依赖性,本算法利用自注意力机制代替循环神经网络构建特征聚合模块。自注意力机制对近程和远程信息都具有直接的捕获能力,同时可以增加计算的并行性。本算法直接基于感兴趣区域进行特征聚合,一方面建模了目标之间的关系,另一方面避免了基于光流的特征对齐操作。为了充分挖掘视频全局信息,本算法对输入视频事先进行打乱,使得每一帧图像都可以获得若干的随机辅助帧。在公开数据集Image Net VID上的实验表明,本算法相较其他现有算法,具有更优的精度性能。3.提出一种基于关键帧策略的快速视频目标检测算法。密集的特征计算和聚合虽然显著地提升了检测精度,但是损失了运行速度。本算法引入了关键帧的策略,提出了一种新的视频目标检测框架,即关键帧进行特征的计算和聚合,而非关键帧进行特征的传播,实现精度和速度的平衡。其中,关键帧到非关键帧的特征传播由基于光流的传播模块完成。关键帧之间的聚合可以由基于改进循环神经网络的聚合模块完成,也可以由基于二维自注意力机制的聚合模块完成。在公开数据集Image Net VID上的实验表明,本算法在明显提升检测速度的同时,也能获得比逐帧检测的方法更优的精度。

其他文献

基于半直接法的立体视觉SLAM研究与实现

近年来,智能移动机器人、无人驾驶、增强现实(AR,Augmented Reality)与虚拟现实(VR,Virtual Reality)等新兴技术在国内外备受关注,在强劲的市场与应用需求以及巨大的商业潜能

学位

同步定位与地图构建立体视觉特征提取半直接法视觉里程计

基于数据挖掘的热泵系统节能运行及泄漏模式识别研究

暖通空调设备的节能高效运行是长期的研究目标。热泵空调系统将低品位热源转化为高品位热能,广泛应用于工程实际,从设计生产到长期运行各个阶段都会产生大量的数据。本文应用

学位

热泵节能运行分析故障诊断数据挖掘关联规则分析

外语微课的多模态话语符际间性研究

随着信息技术的快速发展,多模态话语分析在西方开始出现,话语意义得到进一步解释。国外学者认为话语或语篇就是一个语义单位,意义不仅仅能通过语言实现,也可以通过其他符号系

学位

微课多模态话语符际间性

级联型石英毛细管器件的传感机理比较研究

石英毛细管结构简单、成本低且具有天然的空芯圆对称结构,因此易于与光纤集成形成各种级联结构,是实现光纤传感器的重要载体。基于石英毛细管的传感器件主要包含法珀(Fabry-P

学位

级联型石英毛细管器件法珀马赫曾德尔多模干涉反谐振

改进Faster R-CNN雾霾图像目标检测算法研究

目标检测是计算机视觉领域中的重要基础研究,是图像内容理解问题的重要基础。随着机器视觉技术的深入研究,通过各种智能算法对图像中的目标进行准确识别和精确定位。但是在雾

学位

雾霾图像空域分割模型Faster R-CNN区域推荐定位优化

基于国产平台的LLVM JIT编译优化技术研究

申威系列处理器是采用自主指令集且具有完全自主知识产权的国产通用处理器,已经成功应用在超级计算机、高性能服务器、存储系统、网络安全等多个领域。LLVM作为开源编译框架

学位

申威处理器LLVM即时编译编译后端移植优化

期望位姿设定的移动机器人视觉伺服方法

伴着控制技术的不断进步,轮式移动机器人越来越多地应用于智能交通、家居服务、工业生产等领域。近几年,视觉传感器凭借其低成本和获取图像信息无需接触测量等特点,与智能化

学位

轮式移动机器人视觉伺服单应矩阵无线通信技术

基于DSP的晶体管式精密电阻点焊电源研究

电阻点焊作为一种重要的焊接方法,广泛应用于航空航天、汽车、五金、电子及医疗器械等多个领域。近年来,随着器件、设备的小型化,微型零件的电阻点焊的应用越来越多。微型零

学位

晶体管式电阻点焊电源DSP多模式控制

改革开放以来学界关于政党制度的概念界定

政党制度是一个国家各政党参与政权的制度性规范,体现了各政党在国家政权与社会结构中的地位作用、相互关系、运作方式、实现形式等。改革开放以来,关于政党制度理论的研究日益兴盛。随着政治、经济、社会环境的变迁,特别是政党、政府及社会关系的变化,关于政党制度概念内涵的界定在不同时期也有所不同,代表性观点有“体制说”“制度说”“综合说”等。探究政党制度概念内涵的理论逻辑,理清概念发展的历史脉络和实践效果,有助于在国内外政党制度的实际对比中,凸现中国政党制度的鲜明特色和显著优势。

期刊

改革开放以来政党制度概念界定

基于红外成像模型的夜雾图像去雾算法研究

红外成像系统依据目标物体自身发出的热辐射信息成像,使所获取的红外图像能够显示出具有高热辐射量的场景信息,而低热辐射量的场景信息会在背景热辐射中湮灭。近年来,红外成

学位

红外图像红外成像模型改进引导滤波CLAHE算法

基于特征传播与融合的视频目标检测研究

其他学术论文