基于深度图像数据的人体动作识别

来源 :郑州大学 | 被引量 : 0次 | 上传用户:bennkyoumusi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体动作和行为识别在计算机视觉和模式识别等多个交叉领域一直以来都是一个热门的研究课题。它有广阔的应用前景如人机交互、智能家居、智能监控。早期的人体动作识别研究主要针对彩色可见光摄像机录制的视频数据,在该数据上提出了许多经典的算法。但是由于传统数据本身的局限性,这些算法容易受到光照变化等因素的影响。随着传感技术的发展,廉价的深度摄像机比如Kinect的出现,为研究者解决人体动作识别中的难题提供了新的思路。深度数据不仅不容易受光照变化等因素的影响,还能额外提供场景的三维信息,这使得越来越多的学者转向基于深度数据的动作识别算法的研究。本论文针对从深度图像数据中识别人体动作进行研究,实现了多种有效的人体动作识别算法,具体内容如下:第一,在深度图像的基础上,提出了一种动作特征描述方法。首先利用自适应深度运动图能量来划分时间动作序列,通过分析不同子时间段动作的姿态来获得运动能量模型(MEM),并利用局部二值模式(LBP)对其进行编码,得到MEM-LBP描述符来表示动作特征,经主成分分析(PCA)降维后,送入7)2范数协同表示分类器中进行识别。在MSR Action3D和MSR Gesture3D数据库上进行的测试分析与对比表明了该算法的有效性。第二,引入特征融合方法,在MEM的基础上,提取梯度方向直方图描述子(HOG)得到新的特征描述符,将其与MEM-LBP特征描述符进行特征层融合和决策层融合,并引入核极限学习机(KELM)对动作分类。在数据库上的测试实验结果表明两种融合方法都在一定程度上提升了识别效果,并且决策层融合的效果相对更好。
其他文献
在钢化玻璃需求量不断增加的今天,如何在单位时间内提高钢化玻璃产量和成品率成为了企业竞争的焦点。国内钢化玻璃生产过程中存在诸多不足,如操作程序复杂、生产参数控制不稳定
本文以非等长双平行线阵为基础讨论了基于传播算子的DOA估计方法。  讨论了DOA估计的理论基础,包括信号模型、阵列模型和影响DOA估计性能的因素和评价标准。讨论了三种经典
光正交频分复用技术(O-OFDM)作为长距离、高速率、大容量光通信传输系统的一种解决方案,有很广的应用前景。在信号传输过程中由于光放大器的自发辐射噪声(ASE)、信号的高峰值
随着移动互联网的发展和智能手机的广泛应用,VoIP网络电话逐步从PC平台转向手机平台。面向手机平台的VoIP通信能为用户提供灵活性强的语音信号传输服务,发展前景十分广阔。本
数字化校园为学生提供了一个动态的、开放的网络学习环境,是对传统课堂教学形式的一种补充和扩展。网络课件资源的开发为数字化校园实现其教学提供了保障,使其逐渐形成了一种新
The rapid growth of cellular networks raises enormous constraints to mobile operators, especially due to the limited frequency spectrum allocated to cellular ne
随着射频识别技术(RFID)应用领域的日益广泛,越来越需要面向RFID的射频一致性测试系统。本文围绕ISO18000-6C协议的RFID射频一致性测试关键技术开展研究工作,主要工作如下: