论文部分内容阅读
动作识别以人为中心,是符合人类习惯的人机交互的基础,人体动作包含有大量的信息,在人机合作装配中,机器通过对人体动作的识别,能够更好与人合作装配,提高装配柔性,人体行为识别使得机器能够对人体动作的意图进行判别理解,从而更好地进行人机交互,实现人机合作装配。动作识别逐渐应用到人们生活和工作的各个方面,具有极深远的应用价值。本文对动作特征提取、分类器设计和连续动作分割与识别这三个方面进行了研究。建立了人体动作描述模型。在人体3D骨架信息的基础上将人体的十个肢体对应的角度作为静态特征,将相邻帧之间的肢体角度变化作为动态特征,静态特征与动态特征结合来描述动作,实现了基于肢体角度模型用于人体动作的表示,该模型具有较强的表征能力。通过帧选择算法,根据相邻帧之间的角度距离累计大小选取合适的帧而去掉多余的帧,进一步提高识别效果,降低计算量。构建了基于深度置信网络与隐马尔可夫模型相结合的动作识别模型。在深度置信网络的结构中,采用条件限制玻尔兹曼机代替传统的限制玻尔兹曼机,提高深度置信网络对时变数据的建模能力,采用反馈调节的输出层进行全局微调,用深度置信网络估计隐马尔可夫模型中的观察概率用于识别。相比于传统的识别方法,基于条件限制玻尔兹曼机的深度置信网络模型能够提取高层抽象的具有历史信息的特征,较好的适用于时序动作的识别。用UTKinect Action和MSR Action3D数据库的动作数据进行测试验证,识别结果表明,该算法具有较高的识别率。在单个动作识别的基础上,给出了采用滑动窗口法和动态规划法结合的连续动作分割与识别方法。使用评分机制和滑动窗口法进行初始分割点检测,通过动态规划对分割点位置进行优化。运用训练的动作模型的对数似然值对连续动作进行评分估计分割,较传统无监督方法判断分割点能获得更好效果。