【摘 要】
:
多目标跟踪是计算机视觉中的一个重要研究方向,其在学术研究和实际应用中都有重大的意义。在安防系统、自动驾驶、人机交互等方面有很高的应用价值。现在最常用的多目标跟踪框架是基于检测的多跟踪,其主要是结合检测器提供的检测结果来设计一套有效的关联度量和关联算法,从而将这些检测结果匹配起来,完成多目标跟踪任务。本文主要针对多目标跟踪中的运动建模和外观建模两个方面展开研究,并且结合实际应用分析多目标跟踪中存在的
论文部分内容阅读
多目标跟踪是计算机视觉中的一个重要研究方向,其在学术研究和实际应用中都有重大的意义。在安防系统、自动驾驶、人机交互等方面有很高的应用价值。现在最常用的多目标跟踪框架是基于检测的多跟踪,其主要是结合检测器提供的检测结果来设计一套有效的关联度量和关联算法,从而将这些检测结果匹配起来,完成多目标跟踪任务。本文主要针对多目标跟踪中的运动建模和外观建模两个方面展开研究,并且结合实际应用分析多目标跟踪中存在的挑战。本文首先提出了一个基于深度学习的最优最近邻模板库的多目标跟踪算法,该方法结合了深度学习来提高跟踪的精度,并且通过实验验证该方法取得的改进。其次结合了实际应用,提出了一个针对于机场场面的多目标跟踪算法。具体的工作及创新如下:1.梳理了近些年常见的基于深度学习的目标检测算法,主要从one-stage和two-stage两个方向展开,并且对比了这些算法的优劣以及改进。2.梳理了近些年常见的基于深度学习的目标跟踪算法,主要从单目标跟踪和多目标跟踪两个方向展开。由于很多多目标跟踪算法引入单目标跟踪器来解决一些多目标跟踪中的问题,所以本文首先简要介绍了几种常用的基于孪生网络的单目标跟踪算法,然后从关联度量和关联算法两个方面来对多目标跟踪任务进行总结及说明。3.本文提出了一个基于最优最近邻模板库的多目标跟踪算法,并且在模板库的基础上提出了两个方法,来完成位置预测和外观建模。这个模板库可以获取可靠的目标外观信息,根据这些外观信息,本文提出了结合单目标跟踪器来进行运动建模,恢复漏检的目标;结合时空注意力机制来进行外观建模,从而完成关联度量的计算。最后采用分层关联的方法来根据检测结果生成目标轨迹,并采用区域重分类的方法进一步提升跟踪器的性能。4.本文基于机场场面监视任务提出了一个结合了机场场面先验信息的多目标跟踪算法,该方法结合了ADS-B信号源来完成机场这个特殊环境中的目标检测与多目标跟踪任务,并且提升了跟踪精度。
其他文献
近年来,越来越多的计算机视觉任务与深度学习相结合并取得了突破。目标检测是众多计算机视觉应用中的底层任务,在工业界的部署十分广泛,因而随着这些算法的成熟和性能提高,越来越多的场景开始尝试计算机视觉算法的落地。在这些任务中,车辆目标检测是前景巨大发展迅速的落地场景之一,比如:车辆停车检测、交通违规检测、无人驾驶等。但与学术界不同的地方在于,除了精度,工业界对算法速度和资源消耗等成本问题更为看重。因此本
生成对抗网络作为一种重要的深度生成方法,它具有与输入数据维度线性相关的计算复杂度、不需要对目标数据分布做出任何先验假设、生成逼真样本的能力十分出色等显著优势。生成对抗网络已广泛应用在计算机视觉和自然语言处理等众多领域上,它可以生成各类真实的自然图像、文本、语音等数据。然而生成对抗网络存在的训练不稳定、生成结果存在模式坍塌现象等问题制约着其进一步地发展及应用。因此,改进生成对抗网络的研究及其应用不仅
超宽带雷达具有广泛的应用场景,例如军用弹头识别,飞行器识别、民用机动车识别、行人识别、家庭报警、救灾探测等。由于超宽带雷达属于新体制系统雷达,其目标的回波携带了较宽带雷达信号更为复杂的电磁波谱信息,因此可以通过多种信号分析手段提取到比传统体制更有效的目标识别特征,从而尽可能地利用超宽带体制带来的优越性。本论文主要对超宽带雷达回波进行信号处理后生成的时域高分辨一维距离像(HRRP)与频域电磁散射特征
稀疏贝叶斯学习(Sparse Bayesian Learning,SBL)算法是一种基于贝叶斯理论的稀疏重构算法,在阵列信号处理、频谱感知、雷达定位、图像处理等领域中得到了广泛的应用。传统稀疏贝叶斯学习算法假设噪声服从高斯分布,但是在一些实际应用环境中,存在多种复杂环境噪声,此时传统的概率假设无法提供准确的先验信息,针对这一问题进行改进,可提高稀疏贝叶斯算法在复杂环境下的性能。本文从环境噪声模型的
高动态范围(High Dynamic Range,HDR)图像拥有丰富的色彩和细节信息,能够更真实地表现实际场景,但使用硬件直接捕获HDR图像的方法成本昂贵,难以普及,现阶段大多采用软件算法获取,主要包括多曝光HDR图像获取方法与单曝光HDR图像获取方法。多曝光方法需要处理图像中前景移动所带来的鬼影效应,并进行多帧对齐,而单曝光方法则可以直接避免此类问题。本论文主要研究基于深度学习的单曝光HDR图
视觉目标跟踪分为短时跟踪和长时跟踪。短时跟踪对应的视频时长约在几十秒左右,主要解决跟踪过程中的亮度变化、尺度变化、旋转、运动模糊等对被跟踪目标的干扰。与短时跟踪方法相对成熟稳定不同,长时跟踪中由于视频序列更长,存在的目标变化、遮挡和消失情况较多,常规的短时跟踪网络和算法性能急剧衰减,因此开展长时跟踪方法研究,对解决实际应用具有重要的研究意义。另外,以深度学习为基础的长时跟踪研究近几年刚起步,数据集
在互联网时代,头像在社交平台上起着名片的作用。部分人选择将个性突出的卡通画像作为自己的头像,但是让计算机自动生成符合人类主观审美的卡通头像不是一件容易的事情。生成对抗网络(Generative Adversarial Networks,GANs)作为现阶段主流的生成模型,在图像生成领域做出了巨大贡献,基于GANs的卡通头像生成技术受到了国内外学者的广泛关注。然而,现有的基于GANs的卡通头像自动生
人类视觉系统能够有效快速地找到图像或视频中感兴趣的区域进行处理,忽略无用的信息,但是传统计算机却没有这种能力。在计算机视觉领域中,显著对象检测旨在于让计算机具有和人一样的视觉处理能力,使计算机能够关注场景中的显著对象而忽略背景信息,从而快速处理大量图像,因此显著对象检测成为许多计算机视觉任务的预处理步骤。显著对象谱的好坏,直接影响到其后视觉任务的性能效果,因此提高显著对象检测能力十分重要。本文针对
人体解析是对人体图像中的部位和衣物进行像素级别的识别。基于强有力的语义分割方法并进一步结合有关人体特性的辅助信息是当前的人体解析工作的主要研究路线。我们注意到,当人们在社交网站上分享照片时,往往会分享身着同一套衣服以不同姿势或角度拍摄的多张照片。这些额外的照片天然地可以作为人体解析任务的辅助信息。本文受到这种行为的启发,当对一张人体图像进行解析时,可以提供另一张相关图像的原图作为参考图像,通过寻找
随着我国信息化建设的推进,网络基础设施的不断完善和各种网络应用的普及给我们的生活带来诸多便利的同时,企图对网络进行入侵或破坏的各种网络异常行为也在不断增加。网络异常行为检测有利于及时地对异常情况进行预警和响应,避免或降低异常行为所带来的损失。如何对网络异常行为进行有效检测已成为网络安全领域的重要研究课题。网络行为通常以包和流作为数据载体,近年来基于包的网络异常行为检测和基于流的网络异常行为检测是两