论文部分内容阅读
人体动作识别是计算机视觉中重要问题,并应用到很多方向,例如人机交互,视频标注和基于内容的检索等。虽然动作识别已经取得了很多重大突破,但是仍然面对很多巨大的挑战。例如:动作对齐,关键帧提取,以及视角变形。本文主要工作是利用射影不变量解决视角变化的动作识别问题,目标是保证不同视角下的动作可以正确识别。根据动作分析内容不同可以分成两类:基于关键点的动作识别和基于剪影的动作识别。对于基于关键点的动作识别,本文利用已有的特征数不变量,分别提出时间域和空间域下的两种动作表示方法,分别为时间特征数和空间特征数。特征数是一种新型的射影不变量,由于其适用在任意维度空间的不共面情况,所以可以保证完全的视角不变性。时间特征数适合于动作序列较长,但是跟踪点较少的情况;而空间特征数适合于动作序列较短,但是包括多个人体跟踪点信息的情景。这两种方法具有一定的互补性。基于剪影的动作识别是通过提取人体动作的外轮廓,将动作识别问题转换成形状识别。本文提出一种层次化射影不变量上下文算法。对于每个轮廓点,使用一种从粗到细的描述方式计算射影不变量,保证特征的视角不变性。根据使用不变量特征的不同,分别提出了层次化交比上下文和层次化特征数上下文。另外,为了体现形状的强区分性信息,本文提出一种轮廓分段上下文形状描述子,以轮廓段为基本单元,计算段之间的相似度。为了结合上面两类方法的各自优势,本文提出将它们进行特征融合,使融合特征既能具备最基本的区分性,又能保证视角不变性。最后通过多个国际公用数据库来验证和分析本文算法的有效性。时间特征数和空间特征数优于其他传统的不变量方法,但是易受噪声影响。层次化射影不变量上下文对动作视角变化比较稳定性,而且具有较强的抗噪声能力。并且,与轮廓分段上下文相结合可以进一步提高识别效果。