论文部分内容阅读
深度摄像头的出现,大大推动了人体动作识别的发展。深度摄像头的深度图像能提供拍摄目标的深度信息,这些信息可以使研究者高效可靠地提取出人体的骨骼数据。由于骨骼数据能很好的刻画出动作的动态特征,所以近年来出现了很多基于骨骼数据的人体动作识别方法,这些方法显示出了非常好的识别效果。但是在人体动作识别领域中仍然存在一些问题没有得到有效解决:(1)如何持续地从连续的动作数据流中识别出感兴趣的动作;(2)如何解决动作的类内变化性;(3)如何提高人体动作识别方法的实时性。针对人体动作识别领域中存在的问题,本文提出了一种基于Kinect的在线人体动作识别方法。主要分为以下三个内容:(1)我们采用了基于Lie群的人体骨架表示法去表示每一时刻的人体骨架,与其他骨架表示法相比,基于Lie群的方法可以更好地刻画动作的动态特征;(2)提出了一种通过构建概率模型字典提取概率特征的方法。我们将一个动作看成是人体不同部位的运动的融合,而每个部位的运动又具有多种风格。于是,我们可以利用少量的部位运动风格交叉组合去表示大量的动作风格。基于这个观点,我们分别对所有动作实例间位于同一维的单维时间序列进行聚类,其中动作实例中的每一维时间序列表示人体某一个部位的运动。在聚类完毕后用马尔可夫链对每一类进行建模,获取代表这一类时间序列变化规律的概率模型,同时也表示了一个部位的一种运动风格。所有类别的概率模型组成概率模型字典。概率模型字典存储了人体各个部位的多种风格的运动。然后我们将连续的动作数据流的每一帧及其之前若干帧都看成是一个动作实例,计算这个动作实例中的每一维运动时间序列属于概率字典模型中对应维的概率模型的概率值,所有的概率值组成这一帧数据的概率特征向量。(3)将概率特征提取方法和联合稀疏编码算法结合,提出了一种在线人体动作识别方法。联合稀疏编码是线性的多类分类算法,能有效实现对连续动作数据的在线识别。本文提出的方法在MSRC-12动作数据集上进行了验证,结果显示了本文的方法相对于目前在MSRC-12数据集上表现最好的算法有大约3%的提高,具备了很高的应用价值。