基于孪生网络的候选区域推荐与模板更新的跟踪算法

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:mengyidaocaoren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉目标跟踪是计算机视觉领域中的重要研究方向之一,它被广泛应用在很多领域,其中主要应用在视频监控、自动驾驶和军事指导等领域当中。在当前主要以孪生网络作为发展的目标跟踪方法当中,候选目标区域中推荐的质量显得十分关键。模型更新问题也成为相应目标跟踪方法中的重要研究内容。当前跟踪方法大多数都是采用锚点固定作为推荐的一种方式,该方式所生成的候选区域数量都是非常庞大的,但是质量并非很高。并且在孪生网络中,目标模板的更新方法一般都是以线性更新方法为主。跟踪器使用简单的线性更新方法来更新目标模型,但是不能处理好跟踪过程中外观变化过大的目标模块。为此,本文主要是对基于孪生网络的候选区域推荐与模板更新的目标跟踪算法进行研究。本文主要工作如下:1)本文提出了一种基于启发式候选区域推荐的目标孪生跟踪算法(Heuristic Candidate Region Proposal for Siamese Visual Tracking)。该网络模型由两部分构成,分别是模板分支和检测分支,模板分支主要被用于提取第一帧或前一帧目标图片的特征,而检测分支用于提取当前帧图片的特征。在提取当前帧特征之后,采用概率图的方法来预测目标可能会出现的位置,然后可以使用可变锚点方式在该位置周边生成候选区域;之后推荐相应区域的主要特征,然后经过一个特征适应的网络,使得锚点与相应的特征图进一步的相互适应;最终可以将模板分支与检测分支所提取的特征进行互相关操作,然后取响应得分中最大的值作为输出。2)在SiamHCRP的基础之上,本文修改SiamHCRP的模板分支为自适应模板分支,增强网络跟踪的稳定性。在模板分支中添加一个更新组件Update Net,Update Net使用的是残差学习的方法,然后对相应的训练模型进行更新。其中整个网络总共有三个模板,分别是第一帧模板、当前视频帧模板以及两者间累积模板。并且可以使用跳跃连接的方法将Update Net的输出与第一帧模板连接起来,然后对这两模板进行残差学习之后,下一帧模板的预测就是这个残差学习的输出。为了验证算法的有效性,本文算法主要是利用VOT2016数据集与OTB2015数据集进行实验。实验结果表明,这两种算法在跟踪目标的过程中,均优于SiamRPN与SiamFC的跟踪效果。
其他文献
期权是金融衍生品的重要成员之一,在现代金融市场中,它是以期货为基础衍生出的一种新型金融工具,是金融投资者为实现套期保值和风险管控的核心工具.在过去的三四十年里,国内外金融衍生品的快速发展已经成为了金融市场中最为璀璨的进展之一.因此,如何合理的对期权进行定价是当前金融界和学术界的热门研究话题.近些年来,随着金融市场的不断发展,金融市场中衍生出了很多的新型奇异期权.其中,障碍期权其中一种极具代表性的弱
超声波是无损检测的重要手段,也是水下通讯的重要途径。超声波的发射与接收一般应用压电陶瓷换能器(PZT),但PZT由于自身共振特性,只能实现单点检测,检测范围受到很大限制。近年来,随着光纤传感器的迅猛发展,光纤布拉格光栅(FBG)以其抗电磁干扰、耐高温、抗腐蚀、体积小、质量轻、易于复用等优点,应用于各领域。在超声波传感方面,FBG有着更大的频率检测范围,基于这一特性,FBG超声传感器的研究具有较好的
随着人工智能技术的兴盛和互联网的普及,电子商务为企业带来了发展的新契机。目前,人工智能可应用于电子商务的各个方面,例如电子商务领域中的智能客服。但是,现有的智能客服只能根据顾客输入中的关键字简单地回应顾客,无法进行自动谈判。另一方面,当前的电子商务应用每天都会产生大量数据,这些数据在电子商务中是很有价值的。例如,我们可以使用大数据向顾客推荐商品。除此之外,大数据还可以用来帮助买卖双方之间进行谈判,
随着社会的进步,经济的不断发展,20世纪70年代起光纤传感技术得以快速发展,而双马赫-曾德尔(M-Z)干涉光纤传感系统具有结构简单、灵敏度极高、信号处理容易、方便解调、成本低等优点,在周界安防和管道泄漏检测及桥梁大坝、大型设施建设项目等领域得到了广泛的研究和应用。双M-Z光纤传感定位系统利用外界入侵扰动引起干涉信号的相位发生变化,再通过干涉解调成光强度变化,由光电探测器转化为电信号,利用互相关算法
针对平方根容积卡尔曼滤波高斯混合概率假设密度 (Square Root Cubature Kalman Filter Gaussian Mixture Probability Hypothesis Density, SRCKF-GM-PHD)算法在高杂波条件下对非线性目标跟踪能力弱的问题,该文首先融入改进灰狼算法,实时调节过程噪声Q和量测噪声R。其次,结合改进的渐消因子思想,实时调整SRCKF-G
在人工智能界,常识知识获取一直是公认的核心难题。所谓常识,是指日常生活中人与人之间存在的共识。人们的观念不断改变,常识也在不断发展。常识知识在自然语言处理、计算机视觉等领域都有着广泛的应用,但常识具有隐含性、大规模性、无领域性等特性,并且常识的理解机制尚不明确,使得常识知识获取成为限制人工智能发展的瓶颈问题。目前,根据自动化程度可以将常识获取的方法分三类:手工获取能够得到隐式的常识,但耗费大量的人
在互联网以及信息技术飞速发展的今天,物联网(Internet of Things,IoT)的研究得到了广泛的关注和重视,我国已经将物联网列入了国家的五大新兴战略性产业之一.物联网按照特定的网络协议将物体接入互联网,进行数据的交互,使得物物相连.随着人们生活水平的提高,物联网正在被逐渐被应用到家庭之中,例如家庭中的安防系统,灯光控制系统,温度检测系统等,物联网技术在家庭中的应用使得人们生活变得更加安
道路是现代交通的主要组成部分,对于管理和更新地理信息系统数据库中的道路信息非常重要。遥感图像数据已经迅速成为自动提取道路网络的主要数据源,它可以提供高精度的地面信息以及更复杂的背景细节,还可以进行大规模的道路监控,给道路提取带来了很大的改进空间,然而目前视觉判读仍然是更新道路的主要方式,这种方式成本高、需要耗费大量的时间和物力,给自动提取道路任务带来了影响。高分辨率遥感图像中的道路具有较大的类内差
人脸表情蕴含着丰富的情感信息,在人际交往沟通中起非常关键的作用,如何让计算机正确的识别理解人脸表情信息是一项具有重要意义且极具挑战性的工作。随着深度学习的发展,利用深度学习技术实现人脸表情识别成为了表情识别领域新的研究热点。人脸表情特征大多集中在人脸的局部关键区域,如眼睛、眉毛、嘴巴及其周围区域,人们可以忽略人脸的整体信息,而直接借助人脸的局部关键区域信息,来正确的识别人脸图像中的表情类别。因此,
随着教育信息化的发展,可视化教学成为教育研究者关注的热点之一。如何运用信息技术将可视化教学与学科教学融合的方式来发展学生的科学素养是亟待解决的重要课题。由于晶体结构与性质内容具有抽象性、微观性和复杂性等特点,并且该内容对学生的空间想象能力和立体几何知识要求较高,因此教师在进行讲授时很费力。2017版课标提出教师可以借助实物模型、计算机软件模拟和视频等多种直观手段,降低教学内容的抽象性,促进学生对相