论文部分内容阅读
当今人体行为识别的应用已经延伸到社会的各个方面,尤其是在运动分析、公共场所的安全监测、虚拟现实的实现等方面应用十分广泛,为很多行业的发展带来有利的契机。因此,人体行为识别技术的研究理所当然地活跃在科学研究领域,成为研究热点。尽管目前已经有多种多样的行为识别算法被提出,但是由于人体动作的复杂性,人体行为识别技术仍然存在不足。本文主要针对人体行为识别方法中时序信息缺失的问题,对基于视频序列的人体动作识别展开了研究,本文的主要内容包括:(1)为了克服外在因素对行为识别结果造成干扰,本文对提取到的特征进行了统一化。3D骨架坐标特征对行为识别起到了很重要的作用,但是原始的坐标数据对于行为识别不具有鲁棒性,很容易受到尺度、角度以及活动区域的影响,造成错误的识别。本文为解决这一问题,对坐标数据进行了中心点统一化、尺度统一化以及角度统一化的转变,使得坐标特征具有尺度不变性和旋转不变性,通过实验分析也证实了其具有更好的鲁棒性。(2)为了克服单一特征造成的识别局限性,本文采用多特征融合的方法。骨架特征有很多种,两点间距离、线线夹角、线面夹角、线线方向等等,过多的特征会造成冗余,但单一特征又不能很好地表达运动信息,所以正确的行为识别需要合理的特征融合。本文为解决这一问题,对多种骨架特征进行实验和分析,对能够更好表达运动信息的特征进行融合。(3)为了克服时间信息缺失的问题,本文采用了时序分析的稀疏表示算法作为多维时序建模方法。虽然现存的底层特征能够较好地表达人体动作信息,但对于视频中运动的人体来说,时间信息是具有区分力的很重要的信息,因为人体运动视频本身就是在时间轴上帧的改变和运动。本文为解决这一问题,对时序进行分析,采用加入监督时序混乱的正则项来抑制运动时间上的错误,使得传统的稀疏编码转变为能够处理包含运动信息的多维时序建模方法。通过实验验证了时序信息对稀疏系数重要的影响,以及对分类正确率的提高。(4)为了有效而简单地实现行为的正确分类识别,本文采用匹配误差最小策略。现存的行为分类方法有很多,比如支持向量机、K-近邻等等,但匹配误差最小策略原理较简单,实现较容易,且实验结果理想,因此本文采用此决策方法。实验运行的硬件设备和软件平台由中科院自动化所提供,实验进行于Linux操作系统和Matlab2015b开发平台下。通过在UTKinect和Florence3D这两个RGB-D行为识别数据库上,以及人为模拟数据集上的实验,证实了本文算法对于提高行为分类结果的有效性。