基于时空信息的人体行为识别

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:wf1899
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别技术融合了计算机视觉、数字图像处理、人体运动学等多学科知识,对其研究可以促进相关学科共同发展。同时其在人机交互、无人驾驶、智能机器人、智能监控等领域有着广泛的应用和巨大的经济价值。由于人体行为识别技术兼具理论意义与现实意义,其已成为计算机视觉领域中最为活跃的研究主题之一。准确的获取时空信息是人体行为识别的关键所在。目前主流的行为识别方法存在局限性,如不能提取最显著的空间信息,不能消除背景变化的对识别准确度的影响等。此外,当前方法还存在着提取时间信息时只关注于“帧间运动”或“视频全局运动”的问题。本文为解决上述问题,重点研究如何获准确的提取时空信息,提出了两种基于时空信息的人体行为识别方法:针对当前行为识别模型提取时间信息时易受背景干扰及不能提取最显著的空间信息的问题,本文提出了运动人体关注推理模型。该模型受人脑初级视觉皮层启发,使用时间通路和空间通路分别提取视频中的时间信息与空间信息。结合Focus Block、卷积神经网络和长短记忆时间网络的优点从视频序列中提取时间信息,结合卷积神经网络与全局最大池化操作提取视频中最为显著的空间信息,时间信息与空间信息提取出来后经过拼接层、全连接层等融合为时间信息进行分类。引入了贝叶斯推理块对预测的结果进行校准,用以得到最终的人体行为分类。最终在UCF101和HMDB51数据集上对文中所提方法进行实验论证,实验结果表明基于运动人体关注推理模型的人体行为识别模型可有效提高行为识别准确率。针对当前行为识别方法提取时间信息时只关注于“帧间运动信息”或“全局运动信息”的问题,同时为了精简模型参数降低对实验硬件的要求,进一步提出了基于多尺度运动信息的人体行为识别模型。该模型分别通过时间通路和空间通路获取视频中的时空信息。为了自动从视频中提取多尺度运动特征图,时间通路中使用多尺度运动特征提取器对视频图像做加权累计帧差。融合区对时间信息和空间信息进行拼接融合,最后送入预测区进行分类。最终在UCF101和HMDB51这两个常用具有挑战性的数据集上对文中所提方法进行实验论证,实验结果表明基于多尺度运动信息的人体行为识别模型可以在降低模型储存空间与时间复杂度的同时提升行为识别的准确率。
其他文献
随着陆地资源的衰减匮乏,近年来海洋成为了人类探索和开发的战略要地,金属材料是人类目前制造海下探测器、潜航器和海下构筑物的主要原料。但是金属材料造价昂贵和维护成本过高是各国需要面临的棘手问题。为了改善和缓解以上问题,有必要探索一种新的高性能材料取代金属材料,使其能够胜任复杂海洋环境中的部分工作,力学性能和耐久性能优异且造价低廉。本文通过对聚丙烯纤维增强水泥基复合材料的力学性能和耐久性能进行研究,分析
随着知识经济时代的蓬勃发展,企业、高等院校和研究机构等之间的知识流动已经成为我国产业创新能力提升不可替代的重要途径。高科技产业作为知识密集和资本密集的特殊产业,知
工业机器人是数字化制造的主要载体,离线编程和生产系统仿真软件为机器人自动化项目节省了时间,提高了生产率。本文对离线编程和生产系统仿真技术进行了研究,设计开发了基于
矿产资源是人类赖以生存的宝贵的资源,是人类文明生活日益发展的物质条件基础。中国是一个具有丰富矿产资源的大国,在排弃矿产资源废石废弃物的总量上世界排名第一,排土场在矿山整个生产时期以及闭坑后相当长时期内能否长期保持安全运行是矿山经营管理者必须考虑的重大问题。排土场一旦发生重大变化,就会对矿山生产和周围生态环境产生严重影响。排土场的选址、库容及堆排岩土参数的确定等,不仅直接关系着矿山开采成本,而且对土
云计算市场主要采用按需付费模式,这种模式需要云租户在提交计算任务(例如MapReduce)之前,根据该任务的服务需求(例如完成任务的截止时间)来估算所需要租用的计算资源(例如用于执行计算任务的虚拟机)的数量。在虚拟机性能会发生波动的公有云环境中,为了保障计算任务的按时完成以及减少租用计算资源的费用,租户需要自动化的资源管理系统,来根据计算任务的具体运行情况实时调整租用资源的数量。基于多模态神经网络
当前,我国正处于经济转型的重要关键时期,加快建设创新型国家以及实施创新发展战略是我国眼下亟待解决的一项任务。提高我国高技术企业的创新发展水平和技术研发能力,是当前
近年来随着“一带一路”及“中国制造2025”等战略的实施,我国高铁技术不断往安全、快捷、绿色、智能化的方向飞速发展,成为了我国社会经济发展的重要推动力量。随着高铁技术
对于保险公司来说,风险控制和红利分配是公司的运营中不可或缺的。一方面,公司盈余水平过低可能会导致破产,而建立适当的、有效的预警系统是一种可行的风险管理方法,可以从很
目的:探讨细胞色素P450 2E1(CYP2E1)基因调控酒精游离脂肪酸协同增效性脂肪性肝炎巨噬细胞代谢重编程的分子机制。方法:1建立CYP2E1过表达的酒精性肝炎细胞模型,非酒精性脂肪性肝炎细胞模型,酒精和游离脂肪酸协同增效性肝炎细胞模型、M1型极化型细胞模型、M2型极化型细胞模型,以空载CYP2E1细胞作为对照。在CYP2E1过表达(OE)细胞系和空载(NC)细胞系中各分6组,即空白对照组、酒
随着科技发展进步,三维场景重建在许多领域有着重要的实用价值和应用前景。使用激光雷达数据实现三维建模是近几年得到广泛应用的技术手段,但在特定场景中重建结果会存在目标