【摘 要】
:
复杂背景下的视频人物行为识别和分类在关键人物运动的轨迹特征提取中存在着一定程度干扰的问题,通过关键帧产生的静态特征和视频片段中轨迹产生的动态特征可以对视频中人物行为进行更好的描述。所以设计一种基于动静特征和深度学习的人物动作识别和分类系统实现对视频中人物轨迹特征的自主学习,从而对人物运动产生的不同特征进行更全面的分析,提高不同运动场景的人物动作的识别和分类精度。本学位论文以高效识别和分类视频中人物
论文部分内容阅读
复杂背景下的视频人物行为识别和分类在关键人物运动的轨迹特征提取中存在着一定程度干扰的问题,通过关键帧产生的静态特征和视频片段中轨迹产生的动态特征可以对视频中人物行为进行更好的描述。所以设计一种基于动静特征和深度学习的人物动作识别和分类系统实现对视频中人物轨迹特征的自主学习,从而对人物运动产生的不同特征进行更全面的分析,提高不同运动场景的人物动作的识别和分类精度。本学位论文以高效识别和分类视频中人物动作为研究目标,首先提出一种基于轨迹优化的特征提取方法对视频中人物运动进行描述,然后设计一种基于视频动静特征的特征融合方法对关键人物运动轨迹和背景信息进行特征融合,最后设计一种基于双流改进C3D的视频人物动作分类方法完成视频的人物动作的识别和分类。本文的工作创新主要体现在以下三个方面:(1)利用Faster R-CNN检测出来的人体检测框提取出关键人物的运动轨迹,再计算关键人物运动轨间的余弦测量度来删除重复轨迹,利用FV编码对低级的轨迹特征进行编码,最后通过SVM分类器输出分类结果。在KTH数据集和UCF 101数据集上分别进行人体检测框实验和动作识别实验。实验结果表明Faster R-CNN能够有效检测出人体检测框,在简单的环境中,能有效利用优化后的轨迹,更清晰的表征人物运动的轨迹特征。同时,识别精度和效率相较于原有的i DT方法有了较大的提升。(2)利用基于Alex Net的卷积神经网络对视频帧进行静态特征的提取,通过轨迹构建运动管对视频中的动态特征进行提取,并通过Cholesky变化进行静态特征和动态特征的特征融合,最后通过GRU网络补偿时域上的特征并完成动作的分类。在UCF101数据集和Hollywood2数据集上进行特征融合实验。实验结果表明视频中在静态特征和动态特征的融合比为8:2的条件下识别精度最高。通过聚类的方式对视频中显著运动区域的轨迹进行聚类,可以更好利用视频中的轨迹信息。(3)利用3D金字塔池化层代替原有C3D网络中的最后一个最大池化层,以接受非固定尺寸大小的输入视频。增加一个C3D网络对视频中的光流特征进行提取,进一步丰富特征信息,最后通过早融合和晚融合的方式在UCF101数据集和HMDB51数据集上进行实验。实验结果表明,使用3D金字塔池化的C3D网络可以接受可变尺度的视频输入,识别精度也略有提高;双流改进C3D网络的特征融合早融合比晚融合效果更好。
其他文献
大规模多输入多输出(Multiple Input Multiple Output,MIMO)作为一种新型MIMO技术,被认定为5G中关键技术之一。然而,其诸多的优良性能依赖于信道状态信息(Channel State Information,CSI)的准确性。已有研究表明借助于导频能够估计信道,从而获得CSI。在万物互联的趋势下,有限的正交导频数与接入网络中指数型增长的用户数相矛盾,不可避免使得不同
与传统金属材料相比,SiCp/Al复合材料具有优异的性能,例如高比强度、高比模量以及小热膨胀系数等,在航空航天、汽车工业和电子封装等领域实现了商品化应用。然而,由于SiCp/Al
近些年来,由于分数阶发展方程相比于整数阶方程可以更好地描述物理和化学问题中的实际状态,因此在控制理论中发挥的作用越来越重要.本文主要研究了Atangana-Baleanu Caputo分
Cu2ZnSn(S,Se)4半导体材料因其低毒环保且组成元素在地壳中的储量丰富,适合大规模生产,且随着S与Se含量的不同可进行调整的光学带隙(1.0~1.5eV)和较高的光吸收系数>104cm-1)等优点而成为非常有潜力的制备太阳能电池的材料,备受国内外研究者的关注。其理论效率为32.2%,但目前所制备出来的最高的光电转换效率为12.6%,是2014年Mitzi课题组采用无水肼溶液法制备出来
氧化石墨烯是边缘处带有含氧官能团的二维碳原子结构。由多层氧化石墨烯组成的氧化石墨烯膜,其层间距为0.83 nm,且拥有亲水性的孔及疏水性的通路,使水在其中可以快速传递,并
目前,开发以生物质为基础的可再生生物基产品备受关注。其中以植物油脂为原料通过适当改性生产的生物基多元醇是一种重要的化工中间体,其生产成本稳定,环保可降解,理化性能优
猪塞尼卡病毒A(Senecavirus A,SVA)是最近几年才被确诊的的猪流行性病毒,它可以引起猪口鼻及蹄冠等区域出现水疱、溃疡和溃烂创面等症状。我国于2015年3月出现猪感染SVA疫情,20
企业税负分为企业微观税负和宏观税负两个层面。目前,在我们国家关于企业宏观税负理论的研究已经比较成熟,主要分为三种不同的口径来衡量,大量成熟的宏观税负理论模型可用于
卫星胶质细胞(satellite glial cells,SGCs)由神经嵴细胞发育而来,是背根神经节(dorsalrootganglion,DRG)中包裹感觉神经元的一类具有多向分化潜能的胶质细胞。研究发现,SGCs
纤维编织网增强混凝土(Textile reinforced concrete,TRC)由于定向纤维束的存在,外界环境中的水分容易沿着定向纤维束的走向迁移,从而导致纤维编织网增强混凝土内部基体受损从而抗渗性下降,将严重影响此种纤维增强材料的耐久性,最终为工程加固和修复埋下安全隐患。所以研究纤维编织网增强混凝土在外界压力水作用下而产生的影响十分有意义。为了描述纤维编织网增强混凝土的渗透性,可以通过渗透