论文部分内容阅读
动作识别在生活中有着广泛的应用,而基于Grassmann流形的识别方法是一种采用流形上的线性子空间来表示动作序列的分类方法,在多种动作识别任务中已经取得了成功。为了能够处理子空间数据,不同的度量方法被用于描述子空间之间的相似性,并与分类器相结合来分类动作序列,如采用投影度量的支持向量机。现存的基于Grassmann流形的方法虽然识别精度高,但大多忽略了子空间在表示动作序列时的不稳定性,这可能导致分类器的学习被不正常的扰动所误导。另外,在学习中,存在训练动作数据不足或测试噪声严重的情况,它们将导致分类器无法从有限的训练中充分学习和准确预测数据模式。这些问题都会最终使得动作识别精度下降。为了解决上述问题,本文提出将传统线性空间中的隐式数据扩增方法扩展到Grassmann流形上,增加训练过程的噪声数据样本,且保持较低的计算复杂度,进而提高分类器对噪声的鲁棒性。针对Grassmann流形的非线性特性,本文采用投影映射,得到子空间在欧几里得空间中的同构表示,使得原先的线性方法可以直接扩展到扰动的子空间数据上。然而,使用投影映射在数据空间维度高的时候,计算效率低下。因此,通过对引入了子空间扰动的目标函数的对偶优化,本文提出扰动Grassmann核方法,其与非核方法采用相同的投影映射时,有着更低的计算复杂度。本文的主要工作如下:(1)有别于传统的Grassmann流形上的判别学习,本文考虑了多Grassmann流形的子空间扰动,在采用投影映射的学习中隐式地引入该扰动来改善动作识别的精度,并根据子空间的性质用贝叶斯方法自动选择扰动的参数。(2)根据隐式数据扩增的思想和对偶优化方法,本文提出全新的、更高效的扰动Grassmann核函数,根据核函数的性质和扰动分布的形式,可以进一步得到它的解析形式。(3)根据流形上的扰动分布(伪高斯分布与狄利克雷分布)和Grassmann核函数(投影核函数与切丛核函数),本文推导了形式简单的扰动Grassmann核函数,并分析了这两种扰动与数据噪声的联系。(4)本文在不同难度、不同噪声环境下的动作数据上进行了分类实验,验证了本方法在一般的、低延迟、多视角或附加噪声动作情况下的鲁棒性。