基于深度学习的人体行为识别技术研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:laiyq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别技术是计算机视觉领域的重要研究方向,是视频监控、人机交互、视频检索、虚拟现实等领域的关键技术,有重要的研究价值。深度学习技术在计算机视觉领域的应用,促进了人体行为识别技术的发展。然而,由于人体行为的高复杂性与多变性,以及复杂背景对人体行为识别的干扰等问题的存在,导致人体行为识别技术在现实中的应用面临众多挑战。本文主要针对视频中的人体行为进行识别,围绕人体行为识别的关键技术展开研究,具体工作概括如下:(1)在人体行为的特征提取方面,以DenseNet为基础,提出一种DenseNet3D卷积神经网络用于人体行为识别。该网络采用3D卷积层进行特征提取,在神经网络中引入时空信息用于提高网络性能;构建网络结构时,在将网络前后两层直接连接的同时,在不同网络层之间实现跨层连接,使底层网络提取到的特征能直接映射到顶层,达到加强特征传播,减少网络参数的目的。该网络针对人体行为的高复杂性与多变性,能充分利用时空信息,提高网络中的特征利用率与识别准确率。本文在UCF101行为数据库中对方法进行验证,实验结果表明该网络能有效提高人体行为识别的准确率。(2)在DenseNet3D卷积神经网络的基础上,本文提出基于双流DenseNet3D网络的人体行为识别方法。该方法利用DenseNet3D卷积神经网络分别对光流样本与RGB视频图像样本进行特征提取,其中光流样本的生成采用TV-L1光流算法,该算法利用双向求解机制来降低提取光流的运算量;在分类识别阶段,本方法利用双流网络的得分特征融合机制,将由视频图像与光流通过DenseNet3D网络得到的RGB得分特征与光流得分特征进行融合,生成融合特征并识别。该融合特征同时含有视频图像信息与光流信息,在卷积神经网络引入光流能够减少视频图像中复杂背景对人体行为识别的干扰,进一步提高了人体行为识别的准确率。
其他文献
社区是居民共同生活的地域共同体,是构成社会治理的基础单元,社区治理是国家社会治理的重要基础,也是政府打通惠民政策的“最后一公里”。在中国城镇化和人口流动的背景下,社
在公司治理内涵的基础之上,论述了万科控制权争端始末,并最终得出启示。旨在改善公司治理实践方面提供一些理论基础。
《图兰朵》是作曲家普契尼由童话剧改编的三幕歌剧,是其具有影响力的作品之一。该歌剧叙述了一个西方人眼中的具有中国色彩的传奇故事。《你那颗冰冷的心》是《图兰朵》中柳
我国规模化猪场普遍采用三阶段饲养模式,但由于阶段太少,它不能完全满足其营养需求,会造成阶段性营养供给不足或营养供给过剩,限制猪只最佳生长性能,因此,不少学者开始关注多
薄壁管凭借其低廉的成本和易于加工的特性而广泛应用于能量吸收装置中。近些年来,折纸技术由于在机械性能上的优势也频繁地融入薄壁吸能结构的设计中。本文旨在研究由碰撞吸