整合视觉注意机制与深度学习的人体动作识别方法研究

来源 :中南民族大学 | 被引量 : 0次 | 上传用户:raclen4hy00
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频人体动作识别是计算机视觉领域中尤为重要的一名成员,它广泛应用在智能监控、视频检索和人机交互等领域,受到了很多研究学者的关注。随着深度学习在各个领域的渗透发展,研究学者将深度学习方法应用到视频人体动作识别中,但大多数算法在背景复杂、目标不单一和干扰较多的场景中的识别效果不尽人意。针对这些情况,本文围绕着计算机视觉研究的初衷—模拟人类视觉系统的信息处理机制,提出建立一个整合视觉注意机制与深度学习的人体动作识别系统。首先,利用时空相关卷积长短时记忆ConvLSTM单元给出时空信息特征的提取方式。ConvLSTM结构是卷积神经网络和长短时记忆网络的高效结合体,既吸纳了卷积神经网络的优点,即模拟视觉系统感受野的属性提取空间位置特征,又保留了LSTM在长时序序列问题上的联想记忆功能,因此该结构能够同时提取视频中的空间信息和时间信息,保证视频序列帧与帧的运动信息不丢失,这种时空不分离的特征能够一定程度地提升系统的识别性能。其次,基于人类视觉注意机制的基本原理和信息处理过程,建立了深度学习注意机制与长短时记忆网络(LSTM)相结合的AttenLSTM单元。该单元的实质是模拟人类视觉注意机制,以某种特定的方式对视觉信息进行注意力分配,有选择性地扫描每一个位置,给予人体动作发生的区域更多的关注,而这些关注用向量形式来表示,向量中每个元素在0到1之间取值,每一元素的值就是分配给同一时刻不同位置的权重,最后将权重向量与原来的特征向量进行加权求和。最后,通过改进普通编码器-解码器LSTM模型搭建网络框架。鉴于本文的研究对象是包含图像信息和时序信息的视频,本文不能用普通的LSTM完成编码解码过程,因此采用ConvLSTM结构代替LSTM基于Darknet网络模型来编码视频包含的时空信息,解码阶段则用AttenLSTM结构取代普通的LSTM,由于其独特且有效的权重分配方式,一方面可以增强上下文信息的关联性,一方面减少了冗余的信息加工。为了证明本文模型的有效性,本文选择在KTH数据库和UCF101数据库上进行性能测试,这两个数据库具有很强的代表性,KTH数据库背景简单,干扰较少,动作类别仅有6类,而UCF101数据库背景复杂,遮挡干扰较多,动作类别多达101类。通过对比分析得到的实验结果,可证明本文提出的整合视觉注意机制与深度学习的人体动作识别系统具有良好的识别效果。
其他文献
伴随移动网络的飞跃式发展,第三方支付平台的普及程度越来越高,逐渐成为大众消费中最常见的支付方式。手机号码则成为注册第三方支付平台账号的重要工具,许多人都曾使用过手
风格是文学作品的一个重要特点,由此风格在译文中的传递也尤为重要。《牛虻》作为一部文学作品,以往对它的翻译研究多数局限在社会层面上意识形态操纵对翻译的影响的研究和人
改革开放以来,随着城市化和工业化进程的推进,我国整体经济实力在不断增强过程中也造成了城乡二元分割的特殊制度,与此同时也形成了日益扩大的城乡贫富差距,经济收入上的巨大
南非与中国教育合作涵盖了知识生成、学生交流/整合、提升大字品质与帅资培训。本文旨在研究,南非与中国教育合作的目标、发展与挑战。首先,本文简述了南非与中国教育合作的历史背景,而后探讨了,中国在研究与教育领域开展国际合作的目标,究竟在多大程度上与南非的优先事项是一致的。重要的是,中国每年新接纳的南非学生人数超过2千人,而同期南非接纳的中国学生人数也呈现出相似的增长幅度。基于现有的统计数据,本文详细介绍
认罪真实性是速裁程序实体从宽和程序从简的前提条件。纵观当事人主义和职权主义刑事诉讼中的认罪处置程序,均不接受无事实基础支撑的认罪声明或供述。我国刑事诉讼素有追求
华西边疆研究学会成立于1922年,是由传教士为主的西方学者发起组建的,以华西边疆研究为宗旨的国际学术机构。学会早期主要由西方学者主导,对华西边疆地区展开一系列人类学、自然科学、宗教学以及考古学等方面的考察研究,创办学术期刊——《华西边疆研究学会杂志》,是民国时期西南地区最具影响力的学术期刊之一。20世纪30年代初,学会为适应政局需要,进行本土化改革,20世纪30年代初,中国籍学者开始入会并在抗战爆
我国的强制医疗程序区别于民事程序中的非自愿医疗和普通刑事诉讼案件的重要特征之一,就是其适用对象是实施过刑事犯罪行为,且有社会危险性的精神病患者。强制医疗属于监禁性
在信息过载时代,从大量信息中寻找自己感兴趣的信息是一件非常困难的事。推荐系统作为缓解这一问题的重要工具,可以从大规模数据中挖掘用户的偏好信息,从而向用户提供精确的个性化推荐服务。目前流行的推荐算法利用用户评分、评论等明确反映用户偏好的主观数据预测用户兴趣,但这类数据往往比较稀疏,会制约推荐算法的推荐质量。另外,如何动态捕获用户的偏好变化以及提高推荐的多样性也是推荐系统研究中亟需解决的问题。本文基于
近年来,实践中屡次发生侵犯借条的财产犯罪行为,在经济生活中,借条作为证明债权债务关系存在的凭证,代表一定数额金钱债权,由于经济的快速发展,财产犯罪的对象发生了一些改变
作为刑事被告人的一项基本人权,质证权的确立和实现有着不容忽视的重要价值和意义。西方法治国家和国际人权公约通常将其规定为一项宪法性权利和基本程序权利,能够体现被告人主体地位,是刑事被告人获得公平审判的最低限度的程序保障。相比于西方国家,我国宪法和刑诉法对被告人质证权均未明确规定,目前刑事审判实践中,没有将质证权确立为被告人的一项基本权利,更多是法庭用来查明案件事实的工具和手段。而通过对质证权进行实证