基于深度上下文模型学习的快速视觉跟踪算法研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:zingerler
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉跟踪,就是在视频图像序列中对运动目标进行检测、提取和识别,从而获得目标的位置、速度、加速度及运动轨迹等运动信息,实现对目标运动行为的理解。随着廉价的摄像采集终端的逐渐增多,以及自动视频分析需求量的不断增加,视觉跟踪算法已经开始引起越来越多的关注。但是由于人们对跟踪精度的要求越来越高,对速度的需求越来越苛刻,跟踪场景和目标运动的复杂性不断提高,因此设计一个不受约束的视觉跟踪算法仍面临着很大的挑战,是未来的一个重要发展趋势。本文旨在针对单目标的跟踪问题展开研究,基于实际的复杂场景,提出建立一种深度上下文模型来进行运动目标的跟踪,实现良好的跟踪鲁棒性和精确性。首先,为了能够在前人的基础上提出合理的改进和优化,本文广泛研究了视觉跟踪算法的各种基本理论和技术,对跟踪算法流程进行了划分,并分析各个步骤中常用的一些方法及对比其优缺点,为后续提出新的方法奠定了理论基础。其次,本文基于相关滤波的技术,通过构建滤波模板在图像中进行采样,计算并确定响应最大的位置为目标中心点。通过引入深度图像,可以弥补三维空间到二维平面映射的信息损失,同时利用跟踪目标及其周围区域信息来辅助确定目标的定位。第三,本文引入并优化图像分割中的区域生长算法,利用跟踪目标在深度图像上的连续性和稳定性,实现更加精确的目标的尺度调整。本文还提出了一种依据深度图像判断目标遮挡状态的方法以及相应的模型更新参数的策略,保证在长时间跟踪中鲁棒性性能可以得到提升。最后通过大量定性和定量的对比实验,从综合性能,尺度调整性能,遮挡处理性能等不同角度证明了本文提出的算法在准确性和鲁棒性上和主流的视觉跟踪算法相比要更加出色,同时在速度上也可以达到实时性的要求。
其他文献
学位
NTRU公钥密码体制是由三位美国数学家J.Hoffstein,J.Pipher和J.H.Silverman于1996年提出来的,其安全性基于最近向量问题。NTRU算法的发明是计算机密码学界的一个重大成果,它
智能手机已经成为人们日常生活当中不可或缺的通信交流工具,通过智能收集可以随身随地的获取位置、通话记录、短信、微信等体现人们之间日常交互和社会关系的各种信息,人们之
近年来,脑科学研究成为了先进国家的重点研究领域,欧盟、美国、日本等国家相继提出各自的脑计划。研究人脑机理不仅能够加深对人脑的认识,由此促进脑疾病的治疗技术的发展,并
专利分类可以加快对专利文献的检索速度,并方便对专利文献的管理,有着十分重要的作用。目前我国的专利申请数量逐年提高、增长迅速,传统的人工分类方法已经越来越难以进行,所
信息量的巨大增长对中文在线阅读网站提出了优化要求。一方面要求能根据网页重要性调整网站链接结构,另一方面要求能针对网站内容进行优化,能够对用户查询进行语义级别的理解
学位
本体具有良好的概念层次结构、支持逻辑推理,因而在信息检索领域得到了越来越广泛的应用,大大提高了信息检索的查全率和查准率。在此研究背景下,本文针对本体的半自动构建进
随着计算机和网络技术的不断发展,Web服务的不断普及,单个Web服务的调用已经不能满足服务请求者的需求,服务组合已成为了一种必然趋势。利用Internet上分布的现有的Web服务,
随着高性能计算机计算性能的提高,其存储系统的规模也在不断扩展,单纯依靠传统的硬件平台容错方法已经逐渐无法满足系统对数据可靠性的要求,高性能计算机使用软件方法来保证