论文部分内容阅读
人体运动分析是计算机视觉分析领域重要的研究方向,在智能监控、人机互交、虚拟现实、运动分析等领域均具有重要的应用价值。人体运动分析的研究内容包括运动目标检测、目标跟踪、人体动作识别和行为理解与描述。稀疏编码(Sparse Coding)理论是一种模拟哺乳动物视觉系统主视皮层细胞感受野编码机制的新兴信号表示方法,该方法由于使用超完备字典对信号进行分解,所以对信号的误差与噪声的处理比传统方法更稳健。近年来,许多学者对稀疏编码理论进行了深入的研究,并成功地应用在计算机视觉领域的众多问题中,取得了一些重要的研究成果。 本文以稀疏编码为理论基础,在最新研究成果的基础上展开深入的研究,提出了应用于目标跟踪、人体动作识别和异常事件检测的稀疏编码方法,主要的研究内容和创新点如下: (1)针对经典目标跟踪算法在光照改变、遮挡和形变等情况下精度不高,长时间目标跟踪不可避免发生跟踪目标丢失等问题,在稀疏编码理论框架下,引入结构化信息和联合投票机制,结合自适应模板更新方法,提出了一种基于结构化稀疏编码联合投票的目标跟踪算法。同时,受稀疏编码在目标识别领域成功应用的启发,将目标跟踪视作目标识别问题,而不是传统的搜索问题。所有候选图像组建训练样本集合,目标模板由所有的训练样本线性组合表示。在公开的具有挑战性的视频数据库上进行实验测试,该算法保证在出现光照改变、形变和遮挡等不利情况下进行长时间跟踪的可靠性,相比目前比较成熟的几种跟踪算法,对于出现遮挡的情况,算法的成功率有很大的提高。 (2)针对人体动作识别算法受人体动作的多样性不利因素的影响导致准确性和快速性有待提高的问题,首次提出用l2稀疏编码算法进行人体动作识别的研究。通常在人体动作识别的研究中,无法获得每类动作充足的训练样本,如果用经典的l1稀疏性稀疏编码算法表示输入样本,必然产生较大的重构误差而导致分类错误。为了解决稀疏编码用于人体动作识别的这一瓶颈问题,深入分析l1稀疏性稀疏编码的工作机理,证明在训练样本不充足的情况下,重构误差比稀疏性在分类识别中起到更重要的作用,进而可以降低算法对稀疏性的要求。在建立描述人体动作的距离符号变换时空体特征的基础上,提出了基于l2稀疏性约束条件稀疏编码的人体动作识别方法。与现有的人体动作识别方法进行实验比较,结果表明本文方法在提高识别率的同时,提高了算法的快速性,使算法具有更大的实际应用价值。 (3)针对视频序列图像场景复杂,很难甚至无法提取事件的完整特征的问题,研究了结合LBP-TOP和稀疏编码的异常事件检测方法。在视频数据中提取事件的局部时空体,其数量巨大,这些局部时空体的描述对检测的精度具有重要的影响。采用LBP-TOP纹理算子描述局部时空体,它是用三个垂直平面的二值编码直方图串联描述三维数据,计算简单,可区分性强,适用于异常事件检测。实验结果表明,本文方法提高了检测精度。 (4)针对用于异常事件检测的线性动态系统模型对噪声敏感的问题,提出一种基于线性动态系统稀疏编码的异常事件检测方法。现有的方法对噪声引起的输入变化非常敏感,稀疏编码对噪声的稳健性可以解决这个问题。然而,线性动态系统属于非欧式空间模型,无法直接应用传统的稀疏编码,本文开创性提出将控制理论中的线性变换引入到稀疏编码中,应用约束凸优化公式实现稀疏编码的优化求解。在动态纹理数据库和异常事件检测数据上进行实验,结果表明本文方法计算量小,对于被遮挡的动态纹理仍具有较好的识别率,且提高了异常事件检测的精度。 综上所述,针对基于序列图像的人体运动分析算法中存在的问题,提出了优于现有方法的目标跟踪、人体动作识别和异常事件检测算法,建立了基于稀疏编码理论的人体运动分析新框架,对于人体运动分析领域研究的进一步发展具有重要的理论意义和实用价值。