带旋转估计的目标跟踪算法研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:sb198908240015
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着信息技术的快速发展和数据获取方式的不断丰富,人们对于图像视频类数据的处理需求也越来越多,目标跟踪作为图像视频类数据处理的重要技术,与之相关的研究也变得异常火热。从基于传统计算机视觉技术的相关滤波算法到基于深度学习跟踪模型的出现,跟踪算法的性能得到大幅提升。但是,在目标跟踪领域始终面临着多方面的挑战,如:复杂的背景、光照变化、目标物被遮挡以及运动物体的旋转尺度变化等,严重影响现有目标跟踪算法的性能,使得如何获取准确的跟踪结果成为研究难题。本文基于深度孪生网络及相关滤波的目标跟踪算法展开研究,提出了能应对目标旋转所带来跟踪挑战的目标跟踪模型,并将其应用于空中手写字符识别系统中,取得了良好的性能。主要的研究内容包括:(1)针对全卷积孪生网络(Fully-Convolutional Siamese Networks,Siam FC)跟踪方法存在因目标的旋转、尺度变化而造成跟踪结果不准确甚至错误跟踪的问题,提出一种带旋转与尺度估计的Siam FC跟踪算法。该算法由定位模块与旋转、尺度估计模块两部分组成。首先在定位模块中,利用Siam FC算法获取目标位置,并结合旋转与尺度信息对该位置进行调整;其次,在旋转、尺度估计模块中,鉴于图像的旋转和尺度变换在对数极坐标系下变成了平移变换,将目标搜索区域从笛卡尔坐标系变换到对数极坐标系下,便可利用相关滤波技术估计待跟踪目标的尺度和旋转角度,最终实现了一个能同步估计目标位置、旋转角度以及尺度变化的目标跟踪模型。在POT和OTB两个公开数据集上的实验结果表明提出的算法性能优于Siam FC等几种常用的目标跟踪算法,特别在含有旋转和尺度变化的视频序列上性能提升尤其明显。(2)鉴于深度学习目标跟踪模型的实时性是建立在强算力和GPU加速的基础上,而实时性较好的核相关滤波跟踪算法对算力要求很低,因而我们在核相关滤波跟踪模型的基础上引入旋转和尺度估计模块,分别在笛卡尔坐标系和对数极坐标系下估计目标的位置与旋转、尺度参数,构建了一个能同步估计位置与旋转和尺度参数的相关滤波跟踪模型,并将其应用于实际需求中,开发了一套实用的空中手写字符识别系统。该系统以普通摄像头作为图像采集设备,利用目标检测、目标跟踪及文字识别等计算机视觉和机器学习技术,通过检测指尖和跟踪其运动轨迹来记录并重构出所书写的字符,然后通过训练好的字符识别网络对其进行识别。
其他文献
目的探讨脑卒中患者专科康复后离院时日常生活活动能力(ADL)情况及其相关影响因素。方法以2019年6月至2020年12月海安市某医院康复科收治的脑卒中患者为研究对象,于患者专科康复后离院时对ADL状况进行评估,并采用单、多因素方法对ADL影响因素进行分析。结果 523例脑卒中患者专科康复后的ADL评分为(62.23±18.27)分,其中ADL评分(<60分)较差的脑卒中患者比例为28.49%。多因
阿尔茨海默病(Alzheimer’s disease,AD)是老年人群体中最常见的痴呆类型.因它在发病初期症状极不明显,一经确诊便达到错过最佳干预期的中后期,会严重威胁到受害人及其家属的身心健康,给他们的生活带来了巨大的负担.由于它的病因涉及多个方面,所以到目前为止没有绝对的治疗办法.因此,要对老年人进行初期筛查.为了解决社区大样本条件下AD筛查医护人员不足时对结构能力测评存在的困难,本文从临床上
中国是世界上老龄化较严重的国家之一,脑小血管病是临床常见的在老年人群中易发的脑部血管病,其临床表现多样,可表现为认知功能下降、痴呆、步态异常、情感障碍等.如不对其干预,任其发展下去,极易引发语言功能、认知功能等多种脑功能障碍,导致患者精神恍惚及生活自理能力下降,不仅使患者感到痛苦,对社会对家庭都是一种负担.脑小血管病初期通常症状不明显,容易被患者及其家属忽略而错过早期识别、及时治疗的最佳时期.脑小
分类是数据挖掘领域中一个重要的分支,普通的分类模型通常假设数据集中各类别的样本数量差距很小且对于每个类别的误分代价相等,而使用不平衡数据集训练传统的分类器会导致模型对于少数类的预测精度很低,因此不平衡数据的分类问题一直是机器学习领域的研究热点。本文针对面向不平衡数据的分类方法开展研究,引入了基于样本权值的欠采样方法,样本局部密度计算方法以及样本误分代价计算方法,提出了三种面向不平衡数据的AdaBo
机器学习通过学习样本数据、进行模型拟合或者预测推理等方法,使其在数据集中自动获取相应的理论,从而形成一种与常规方法互补且具备可行性的算法,其主要适用于缺乏一般性理论及规模较大的数据集中。物理学可以用来探究物质运动的规律,随着物理学研究的不断发展与进步,机器学习算法也成为了研究物理学问题的热门算法。该学科虽与机器学习处于两个不同专业领域,但其在处理问题的思想上存在诸多共通之处。因此,可通过机器学习来
当下,人们生活中的衣食住行都向着智能的方向改进,而这一切都离不开对数据信息的挖掘。智能的生活方式产生了海量数据,数据挖掘就是从大量数据中发现其中潜在信息的过程。在数据挖掘领域中,高维数据导致的维度灾难和数据过拟合是困扰研究人员的两大问题。特征选择是一个重要的数据预处理步骤,通过从候选特征集中挑选出重要的特征组成新特征子集,利用该子集进行模型训练等学习任务。进行特征选择可以有效地克服维度灾难问题,缓
目前,越来越多的计算机视觉系统被广泛应用于各个行业,这些计算机视觉系统大都以输入清晰图像为前提进行工作,但是在实际场景中,特别是在室外环境下,由于雾、霆等天气原因,我们无法保证获取到清晰可用的图像数据,因此图像增强技术越来越受到研究人员的关注。应用水下机器人进行水下探测是一项重要任务,而计算机视觉技术是完成这项任务的关键环节。但是光的吸收和散射现象同样存在于水下环境中,比起有雾图像,水下图像会遭受
随着5G、互联网、云计算以及其他技术的迅速发展,网络环境日益复杂,且攻击形式日益多样化,也为网络空间安全带来了严峻的考验。网络入侵检测技术采用一种主动防御方式来维护网络的安全,为网络提供实时的监控与动态的保护。面对海量的网络数据,现有的入侵检测模型不仅无法有效处理这些高维且复杂的数据,也难以识别数据样本较少的攻击类型,且模型检测效率低、识别率较差。基于上述问题,本文提出了基于PGoogLeNet-
近年来,随着物联网迅速发展,射频识别技术(RFID,Radio Frequency Identification)被广泛应用于物流追踪、身份识别与国防军事等多个领域。目前,由于有芯片RFID传感器标签制作成本较高,所以设计低成本的无芯片RFID(Chipless RFID)传感器标签成为现今研究热点。本文针对无芯片RFID传感器标签的抗杂波性能进行研究与设计,具体从传感器标签的结构设计、极化转换特
网络资产是指连接到互联网的网络设备、安全设备、中间件、服务器、个人计算机等设备的类型和版本、操作系统类型、IP地址、开放端口及端口服务等信息。对网络资产进行探测和管理既可以帮助企业网络资产管理人员清楚地了解企业内部拥有的网络资产,又可以作为渗透测试人员或黑客开始工作前的信息收集,因此,对各种网络资产信息进行有效探测是必不可少的。其中,操作系统是各种设备运行的基础,当前市面上的操作系统类型众多,而现