基于姿态检测和语义分割的人体动作识别

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:gomo08
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体动作识别是计算机视觉的重难点问题,是进行场景理解和人际交互的基础,在视频监控、虚拟现实、自动驾驶等领域有着广泛的应用。本文主要研究基于RGB信息的动作识别,相较于Kinect获取的RGB-D视频,RGB视频的数据量更大,应用面更加广泛。目前采用主流的算法是一种是卷积神经网(CNN)进行特征抽取,循环神经网(RNN)进行时序信息学习,最后进行分类;另一种是将空间和时间的特征融合,统一进行学习和分类,如3DCNN和CNN联合池化等。目前大多数深度学习算法关注的是网络结构,通过改变模型结构和微调数据集来提升模型的性能。而实际上,视频图像中包括丰富的视觉线索,静态的包括背景和物体,动态的包括场景变化,人体的姿态和运动状态等等。如何选取和融合有价值的视觉信息,是视频动作学习问题面临的新挑战。针对上述问题,本文利用光流信息和人体姿态信息作为视频中动作信息的补充,采用CNN进行空间域的特征提取,利用长短期记忆网络(LSTM)进行时间域的训练学习,最后在光流和姿态模型的基础上,结合场景特征模型进行融合估计。本文的研究工作主要如下:1.研究了姿态识别问题的难点,并结合具体场景进行了应用。对人体姿态识别问题进行了研究,重点介绍了卷积姿态机(CPM)方法。结合生产线流水操作的实际场景,利用卡尔曼滤波算法实现了对多个操作人手臂的实时跟踪,并对实验结果进行了分析。2.利用一种深度卷积网络,实现了动作图像的语义分割。针对全卷积网络(FCN)精细度和运算效率有限的问题,使用了一种深度编码-解码网络框架(Fast-Net)进行人体部位分割,并将条件随机场(CRF)嵌入到网络中进行优化。在MPII和AI Challenger数据集上进行了实验,证明了该算法在正确率和效率两方面的提升。3.基于光流和姿态信息,提出了一种多模型融合的动作识别框架。该框架将深度学习(Flow-Net)得到的光流图,图像分割(Fast-Net)得到的姿态图以及原图作为输入,分别通过CNN和RNN建立多通道模型,最终对动作分类结果进行融合。在动作识别主流数据集HMDB51和UCF101上进行了实验,主要从准确率的角度对实验结果进行了分析。实验证明了使用人体姿态和光流信息能够有效提升检测准确率。
其他文献
目的:将系统的、个体化的延续性护理方案与现代互联网及新媒体技术有机融合,并应用于稳定期慢性阻塞性肺疾病(Chronic obstructive pulmonary disease,COPD)患者;探讨基于现
贫困问题,是现在世界上许多国家共同面临的一个问题,也是每个国家在现代化发展过程中所不可回避的问题,新中国成立以后,几代党和国家领导人在继承马克思主义消除贫困思想的基础上带领全国人民开展贫困治理工作,但贫困问题仍然是实现全面小康社会这一目标的短板。党的十八大以来,习近平同志在继承前人的反贫困思想基础上,深入实地考察,了解人民的生活情况,提出了一系列的重要论述,不断地发展成新时代的扶贫观,为新时代扶贫
在量子信息处理任务中,由于环境与主系统的耦合,我们很难避免噪声引起的错误.因此,如何有效的控制噪声是量子信息中最常研究的内容,其中最有效方法则是量子纠错码空间.这种方
高考对于大多数学生来说都是人生中一次重要的转折点,高中时期也是学生心理、生理发展迅速的时期,在这个特殊的时间段,学习占据了学生们生活中的绝大多数时间,英语成绩对高考总分起着至关重要的作用,学生们期望获得更优秀的成绩。近年来,国家对少数民族地区中学生的教育越来越重视,由于双语教育的实施,以及教育体系的不断完善,对于少数民族中学生学习成绩方面的研究也在不断增多,然而,对蒙古族学生英语学习动机的研究还不
能源问题关乎整个人类的生存和发展,由于传统能源对环境的污染,可再生清洁越来越受到世界各国的重视。我国的风电发展迅速,风力机在工作过程中,其叶片受到空气的摩擦阻力,造成一定程度的流动损失,因此,研究风力机表面微结构减阻对提高翼型的气动性能、增加风力机对风能的利用效率具有重要意义。首先,对翼型结构和其工作原理进行分析,参考前人在仿生微结构上的应用,运用CFD仿真计算中的RNG k-ε模型对DU21翼型
碳纳米材料因为其特殊的纳米结构和良好的导电性能被广泛的应用于锂离子电池负极和超级电容器。但是碳纳米材料作为锂离子电池负极,与锂离子结合能力较弱,碳纳米管锂离子电池
随着中国经济的快速发展,中国工业化进程开始加速,中国制造业作为工业化的重要组成部分,发展同样非常迅速,中国制造业的发展推动了中国焊接材料市场的蓬勃发展。但是F焊接材
目的:通过化浊益髓法干预治疗脑小血管病认知功能障碍,希冀提高患者的生活质量,延缓脑小血管病造成的认知功能障碍的进展,为其治疗提供更多选择,并通过对一些指标的观察为脑小血管病认知功能障碍的相关因素的研究提供临床资料;通过对脑小血管病的中医辨证分析以丰富中医理论,充实“血浊理论”内涵,剖析血浊伤髓的病理改变,并为血浊伤髓的理论研究提供临床支持。方法:收集符合纳入标准的72例病例,随机分为常规治疗法组和
学位
三阴性乳腺癌(TNBC)是一种好发于年轻女性并且死亡率很高的侵袭性乳腺肿瘤。由于TNBC容易发生复发和转移,并且缺乏靶向治疗的生物标志物,TNBC患者死亡率较高,目前以传统化疗为主,但是TNBC患者对化疗不敏感,疗效不佳,因而寻找TNBC的有效治疗靶点仍然是乳腺癌研究领域的热点。PLK1是一类在细胞有丝分裂过程中起调控作用的重要蛋白激酶之一。已有研究表明PLK1在包括三阴性乳腺癌在内的多种癌症中高