【摘 要】
:
步态是一种流行的生物识别技术,可以远距离识别人类。它应该是唯一可以在远距离收集的生物特征。由于其独特的优势和在视频监控中的巨大潜力,在过去的20年中,许多研究人员对其进行了研究。尤其是近几年来,随着深度学习的发展,步态识别有了很大的提高。如今指纹、人脸识别的技术愈发成熟,但是步态识别技术的应用还面临许多挑战,比如摄像头视角变化、衣着变化等对识别的影响,所以我选择步态识别这个课题,希望能为解决步态识
论文部分内容阅读
步态是一种流行的生物识别技术,可以远距离识别人类。它应该是唯一可以在远距离收集的生物特征。由于其独特的优势和在视频监控中的巨大潜力,在过去的20年中,许多研究人员对其进行了研究。尤其是近几年来,随着深度学习的发展,步态识别有了很大的提高。如今指纹、人脸识别的技术愈发成熟,但是步态识别技术的应用还面临许多挑战,比如摄像头视角变化、衣着变化等对识别的影响,所以我选择步态识别这个课题,希望能为解决步态识别中的难题提供一些思路。因为步态是一种行为特征,并且在时域中包含对象的一些独特运动模式,所以在步态识别中同时使用空间信息和时序信息更加合理。本文对步态视频序列进行研究,提取时序上的特征,最大化对时序信息的利用。首先,设计了多尺度时间网络(MSTN)来提取序列中的时序信息。多尺度时间网络(MSTN)受到快慢网络(Slow Fast Network)的启发。多尺度时间网络不仅保留了帧的完整性,而且增强了动态信息,可以有效地利用视频序列中的时序信息。在多尺度时间网络(MSTN)中,以不同的时间尺度来构建时间金字塔,并最终整合每个时间尺度的信息。高帧率可保留所有帧的空间信息,而低帧率可增强帧之间的动态变化,通过提取每个尺度的特征来获得多个尺度的时序信息。为了验证算法的有效性,在CASIA-B步态数据集上进行了实验,得到了较高的准确率。其次,通过时间-空间图注意力网络(STGAN)从视频序列中提取空间和时序特征。时间-空间图注意力网络(STGAN)引入了基于图的时序特征结构。在空间域,选择出一些具有识别力的区域,并增强它的权重,这样可以使网络专注于这些区域。在时间域,构造时空图(STG),来描述不同帧之间的关系,和区域之间的变化关系。该方法可以在空间和时间域上有效地提取步态特征,并且可以对模型进行端到端的训练。通过对比实验,并在CASIA B步态数据集和OU-ISIR跑步机数据集上都进行了验证,实验结果证明所设计的网络是有效的。本文提出的方法引入了两种思想来提取步态序列中的时序信息:不同时间尺度的时序信息融合,和构建图结构描述时序信息,也通过实验证明了他们在提取时序信息方面是有效的,时序信息能有效地提高步态识别的准确率。
其他文献
数字图像处理近年来得到了极大的重视和长足的发展,并在科学研究、医疗卫生、通信方面得到了广泛的应用.在实际图像形成、传输的过程中,由于各种干扰因素的存在图片会受到噪声的污染.这严重影响了人们对数字图像的认识,所以图像复原在图像处理中十分重要.本文主要针对脉冲噪声(特别是椒盐噪声和随机值脉冲噪声),提出基于鲁棒分形图像编码的原始对偶算法和低秩加权核范数算法,数值实验也说明了这两种算法的有效性.具体研究
大数据时代,聚类分析是探索性数据分析不可或缺的工具.与分类相异,聚类是在无监督环境下进行的.在聚类分析中,人们通常认为彼此接近的点往往属于同一个类别,这就是所谓的聚类假设.通常情况下,同一类中的模式比不同类中的模式相似性更大.当我们把研究对象数字化为多维空间当中的点时,模式之间的相似性可转化为对应数据点之间的邻近度(或相似系数).根据聚类的这些特点,本学位论文提出了一种基于类内邻近度的聚类算法框架
在真实场景中,由于被拍摄物体快速运动、拍摄者手抖等各种原因,使得运动模糊成为最常见的模糊类型之一,运动模糊图像复原技术成为了一大研究热点。近几年,随着计算机处理速度和存储能力的提升,在运动模糊图像复原这一任务中,利用深度学习对模糊图像进行复原的方法发展迅速,该类方法使用卷积神经网络自动估计模糊核,显著提高了复原效果。主流的运动模糊图像复原算法均需要使用成对的数据集进行训练,而获取成对的数据集往往比
图像分割是按照不同特征将图像划分成互不重叠、具有独特性质的各个区域,从而提取感兴趣目标的位置或者边界的过程.这一技术是进一步图像分析、理解的基础和关键,被广泛应用于多个领域,特别是在图像处理领域占据着重要的地位.迄今为止,上千种分割方法已被提出,通常都是针对特定问题的图像分割方法,具有一定的针对性和局限性,无法形成一个适合所有类型图像通用的分割算法.基于变分水平集方法和基于区域的活动轮廓分割方法在
背景:人工全膝关节置换术(Total knee arthroplasty,TKA)中在使用旋转平台假体(Rotating-platform prosthesis,RP)时,对后交叉韧带的不同处理方式中有两种假体设计分别对应两种手术方式,其中一种是后交叉韧带保留型旋转平台假体(Posterior cruciate-retaining rotating-platform prosthesis,CR-R
量子计算是依赖于量子力学原理来获得解的一种新型计算模型,由于量子计算的并行计算能力,量子计算在解决某些特定问题时,它比经典计算的效率要高。Grover量子搜索算法是量子算法中具有广泛应用前景的一种算法,算法可以在量子线路复杂度为/O(2n/2)的情况下求解一个规模为2n的搜索问题。本文从降低Grover算法的量子线路复杂度的角度出发,提出两种改进的算法,并将改进的算法应用到3-SAT问题上。1.为
随着信息化和数字化的快速发展,人们对信息传播质量的要求日益提高,作为传播最为广泛的媒体之一,数字图像的成像质量也成为了各行各业关注的焦点。然而,成像硬件、成像环境以及传输技术等条件的限制往往会降低图像的分辨率,导致图像信息的丢失。因此,如何将低分辨率图像通过算法重建为高分辨率图像始终是图像处理以及计算机视觉领域的一个热门研究方向。近几年利用深度学习算法进行图像超分辨率重建的研究逐渐增多,同时也取得
单目图像的三维人体姿态估计是计算机视觉中一项基本但富有挑战的任务,其目的是检测单目图像中的人体姿态并将其投影到三维空间中。随着科学技术的快速发展,三维视觉已成为人工智能研究和应用的热门领域,越来越多的专家学者投入到该领域的探索中。三维人体姿态估计精度一方面受图像外部遮挡、自遮挡和光线等因素影响,另一方面人体结构的特殊性也会给该问题的解决带来诸多困难。并且,如何将二维空间提升到三维空间本身是一个复杂
随着大数据、人工智能的高速发展,大数据系统平台数据量的规模呈爆炸式增长,庞大的数据量对数据存储和网络传输提出了不小的挑战,为了应对这一系列挑战,必须保证大数据平台数据存储中心的高效率存储和网络传输的高吞吐量,对平台上待存储的数据先进行压缩后再处理是应对这一挑战的有效手段,Gzip压缩算法因其压缩率高、压缩速度快被广泛应用于数据压缩领域。传统的Gzip软件压缩虽然可以实现数据压缩,但会占用通用处理器
随着大数据时代的到来,挖掘海量数据流的实时价值对于各行各业来说越来越重要。这类高速产生的流式数据通常具有实时性、动态性及持续性等特征,并且人们很难预测其未来的分布特性。分布式流处理系统可以满足企业人员处理实时数据流的需求。为了提高处理数据流的吞吐量,分布式流处理系统会利用流应用中的数据并行性。然而,倾斜分布的数据流常常会导致算子的并行实例之间的负载分配不均衡。其中,高负载的节点会拖累系统的处理速度