基于深度学习的目标跟踪算法研究

来源 :江西理工大学 | 被引量 : 0次 | 上传用户:lishao_minlimin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标跟踪近年来取得了显著进展。经过优化以识别图像中物体的深度神经网络模型显示出前所未有的任务训练精度,并且具有很好的泛化能力。本文采用卷积网络深度学习方法主要研究目标跟踪算法,具体研究内容如下:
  (1)针对提取特征方法的不同将算法分为人工设计特征的跟踪算法和深度学习跟踪算法两大类,详细分析了它们的方法思路和模型结构;接着选择当下最流行的数据集对算法进行评估比较并分析不同方法会对跟踪结果造成的不同差异的原因,便于研究者选择合适的方法实现期望达到的性能,清晰地展现出深度学习方法应用于目标跟踪乃至计算机视觉领域的广阔前景和研究意义。
  (2)基于深度学习的目标跟踪算法与使用人工设计特征的目标跟踪算法相较具有很多优势,但也存在一些不足,比如深度学习有监督的训练数据不足,深度学习算法普遍具有的实时性不佳的问题等。针对这些问题,提出一种方法首先采用孪生网络结构训练一个具有普适性的跟踪器使其不需要面对不同视频时进行针对性训练,并采用相关滤波器代替SGD方法加快跟踪的速度,同时给相关滤波器增加相关的正则项优化其性能。在OTB基准上首先与基准框架跟踪器比较得出改进优化后的性能增益,再与其他使用人工设计特征和深度特征的跟踪器比较可以得出结论:与人工设计特征的跟踪器相比,深度特征的使用可以显著提高跟踪性能。
  (3)引入目标检测技术,使用目标定位方法进行目标跟踪。通常目标定位方法中的候选块都会随机地放置在先前目标位置和估计目标位置的周围,但是这样提取特征时会造成了大量的冗余。于是提出一种加速基于卷积神经网络的跟踪器运算的新方法,将整个感兴趣区域一次性输入卷积神经网络以消除生成随机候选块时产生的冗余运算。首先将每个候选块分类为对象或背景,然后分出目标所在对象块作为为粗略定位,最后将卷积神经网络特征的双线性插值用作精细定位。通过在OTB100上的实验结果表明,不仅保持了与顶级跟踪器相当的精确度和鲁棒性,还获得了数倍的加速。
  (4)最新的目标跟踪工作集成了跟踪和检测方法利用两者的优点,融合生成式和判别式方法明显提高了跟踪器的跟踪能力。于是提出了一种融合方法,将深度学习和粒子滤波相结合,融合了判别式框架和生成式框架的优势,以满足有效跟踪可变形和遮挡目标的要求。首先引入区域推荐优化(RegionProposalOptimization,RPO)方法,去除不合格的区域推荐从而大大提高定位精度,并且用动态建模的方式模拟由运动和遮挡引起的目标对象外观变化,使算法能够自适应地更新目标模型,从而提高跟踪器对高速运动和遮挡引起的外观变化的鲁棒性。
其他文献
为了满足日益增长的对通信容量的需求,实现全光网络是未来网络的必然趋势。目前光交换网络采用的基于波长选择开关(WSS)的可重构光分插复用(ROADM)广泛使用半导体激光器作为光源。相比较于半导体激光器噪声大、成本高,光纤激光器噪声小、波长一致性好、成本低且易于集成到全光网络中。窄线宽光纤激光器由于其线宽窄、光束质量高而广泛应用于密集波分复用系统、相干光通信、激光雷达、光纤传感等领域中。而直接输出高阶
信号稀疏表示能够有效提取信号中最本质的特征,在压缩、特征提取、去噪、超分辨率重建等信号处理领域有着广泛的应用。例如备受国内外研究学者关注的压缩感知理论正是建立在稀疏表示理论基础之上的,这也进一步表明了稀疏表示理论的重要价值和巨大应用潜力。但稀疏表示理论仍有许多问题有待进一步解决。  以图像为例,传统的稀疏表示算法首先需要将图像信号进行分块,然后将所得的图像块列化为向量的形式,这样不仅破坏了图像邻域
在线视频服务已成为互联网的主流应用。为提高视频用户的满意度和视频服务提供商的收益,如何理解、预测并提升在线视频服务中的用户体验质量(QoE)已成为研究者普遍关注的问题。  一方面,为准确预测QoE,现有工作主要关注吞吐量、缓冲率等客观服务质量(QoS)因素与QoE的相互关系,然而实际上,用户对视频内容的主观偏好与QoE也密切相关。更复杂的是,一定的用户偏好度及QoS等级还可能引发用户在观影过程中的
近年来我国高速铁路快速发展,越来越多的乘客期望在高速移动环境下获得安全稳定的互联网服务。因此,基于智慧协同网络理论研究成果,我们实验团队提出了智慧协同高速移动网络SCN-R(Smart Collaborative Networking forRailway),其良好和稳定的带宽表现引起了国内外学者的广泛关注。在智慧协同网络理论体系下,支撑SCN-R的网络组件被定义为高速移动业务族群。随着SCN-R
全光网络是未来网络通讯系统的发展方向,其相对于目前广泛应用的基于光电变换的网络,具有安全度高、容量大、阻塞小等重要优点。全光网络仍需攻克的技术难题包括:发送端的光源适配、传输链路的通信容量扩增,以及网络交换节点的全光化等。针对上述关键技术,本文针对性地研究和阐述了多项内容:发送端方面,搭建了两种多波长光纤激光器和单纵模窄线宽光纤激光器;传输链路方面,对于模分复用系统中广泛应用的少模光纤,提出了一种
学位
河道信息提取对于水资源调查与监测、水利评估与规划、气候监测、地图匹配、洪涝灾害预防及船舶导航等许多方面具有重要的意义。传统的野外测量需要消耗大量的人力物力,不适用于河道信息的及时监测与适时获取。随着遥感对地观测技术的不断成熟,利用遥感图像提取河道信息已成为一种重要的手段。本文主要研究从遥感图像中自动提取河流目标和对河流类型进行识别的方法。本文的主要工作包括河流遥感图像的预处理、河流目标的提取及河流
学位
随着无线用户数量的不断增加以及无线多媒体业务的蓬勃式增长,对下一代无线通信系统提出了更高的技术指标要求(低时延、低功耗、高可靠等),但实际通信系统环境更加复杂和更加恶劣。从无线通信物理层来看,由于无线通信系统设计结构更加复杂,所带来的复杂噪声干扰问题,不同频率信号调制带来的不同信道衰落问题,以及可能存在的信道非平稳问题。为了解决这些系统物理层存在的问题,本博士论文的研究动机受到压缩感知理论以及自适
随着网络技术的发展和用户带宽的提升,未来网络业务的关注重点从传统的传输层面的服务质量(QoS)升级为用户层面的体验质量(QoE)。如何提升用户的体验质量,从而提升用户的认可度和黏度,是当下网络业务发展亟待解决的问题。本论文紧密围绕着视频业务中的用户体验感知关键技术这一科学问题,通过采集视频网站的视频数据和多个运营商的现网数据,分别建立了基于混合非均衡算法的用户投诉预判模型、基于人工神经网络的直播个
学位
BV的英文全称是BacterialVaginitis表示细菌性阴道病,是一种常见的妇科疾病。医学常常利用人的眼睛来识别指示剂与提取液反应后的颜色变化,从而进行BV诊断,但是人眼的分辨率以及对颜色敏感程度的局限性使得这种检测方法对BV病情的诊断结果存在有较大的误差。  本文旨在研究一套新型的反应孔颜色识别算法,有效的找到与待测反应孔颜色最为接近的标准色块,能够更加精确的输出待测项目的检测浓度,实现患
学位
该学位论文首先分别介绍了嵌入式系统定义、构成、特点和应用现状及前景,一般组态软件的产主、发展、现状和前景.然后对嵌入式系统和组态软件的结合进行了简要的论述,并介绍了目前嵌入式组态软件的发展状况,简要分析了其发展前景.而且说明了该课题的目的和意义.随后,论文从嵌入式系统的硬、软件平台入手,分析嵌入式系统的硬、软件构成以及他们的特点.接着根据对国内外多种基于PC的组态软件的分析,归纳总结了一般组态软件