【摘 要】
:
人体动作识别是计算机视觉领域中一个十分重要并且十分具有挑战性的课题,它涉及到的应用场景十分广泛,包括人机交互、安防监控、自动驾驶等等。传统的人类动作识别主要是基于
论文部分内容阅读
人体动作识别是计算机视觉领域中一个十分重要并且十分具有挑战性的课题,它涉及到的应用场景十分广泛,包括人机交互、安防监控、自动驾驶等等。传统的人类动作识别主要是基于RGB视频,但RGB视频存在计算量大、易受光照条件影响、对背景噪声敏感等缺点。得益于人体检测算法的成熟,越来越多的研究集中于基于骨骼的人体动作识别。然而,由于基于骨骼的非栅格化的结构和骨骼点的高自由度,给基于骨骼的人体动作识别带来了两个困难:一个是难以构建合适的骨骼节点空间上的特征提取结构;另一个是难以捕获骨骼点间复杂的时空交互模式。基于此,本文主要对基于骨骼的人体动作识别任务进行深入探究,主要的贡献如下:针对基于骨骼的人体动作识别存在关节点多、自由度大,存在学习困难的问题,本文提出了骨骼点空间域上的多头注意力机制,并针对性提出了两项指导多头注意力学习的优化约束项,分别是空间差异化约束和局部连续性约束。通过对实验的分析和对多头注意力的可视化,我们证明了所提出方法可以有效捕捉到跟动作最相关的骨骼点。同时,我们还进一步开发骨骼序列的二阶特征,使模型更好的捕获动作的多角度特征。同时,针对基于骨骼的动作序列存在动作类别复杂、序列长度差异大,现有的基于时间卷积的方法难以捕获动作的长时依赖特征,本文提出嵌入图卷积的长短时记忆神经网络(LSTM)模型。LSTM模型是常用序列模型,相比RNN模型能更好的解决学习长序列时出现的梯度消失或梯度爆炸的问题。而把图卷积嵌入到LSTM模型中,能同时学习动作序列长时和短时的时空交互特征。同时,我们提出了两种双向的嵌入图卷积的LSTM模型结构,能让模型学习到更复杂的时空特征。对比实验的结果表明,我们所提出的模型相比基于时域卷积的模型取得了更好的实验结果。最后,我们提出了一个基于动作预测的多任务学习框架。在人体动作分析中,人体动作识别和人体动作预测往往被当做两个独立的任务被研究。本文把动作识别和动作预测这两个存在较强相关性的任务一起学习,让动作预测支路引导动作识别模型去关注更多的动作细节。实验的结果证明了引入动作预测支路可以进一步的提升模型的结果。
其他文献
换热器管束、反应釜、脱水仓等化工流程设备在高温下运行一定周期,接触介质的壁面上会粘附厚度不等的结垢物。采用高压水射流这一物理方法清除结垢物是停车检修的一项必要工
本研究采用整群随机抽样法,抽取成都、重庆等地223名幼儿园教师作为调查对象,通过问卷调查发现幼儿园教师共情能力的发展特点及与师幼关系的联系。调查结果显示,幼儿园教师共
为研究氟苯尼考环糊精包合物的药代动力学及生物利用度,将健康白羽肉鸡24只,随机分为两组,每组12只,分别以20 mg/kg的剂量单次灌服20%普通氟苯尼考粉(A组)和20%氟苯尼考环糊精
2019年12月10日,最高人民法院发布了《最高人民法院关于审理行政协议案件若干问题的规定》(以下简称“行政协议解释”)。这是我国第一部有关行政协议案件的司法解释,它的出台,解决了许多行政协议在实务中存在已久的问题,具有极其重要的意义。《行政协议解释》首次规定了在行政协议案件中,人民法院可以作出撤销判决,并且明确了撤销的对象既可以是行政协议,也可以是行政主体行使的行政优益权行为。同时对于撤销判决所
行政协议自身的行政性与合同性使其在面对纠纷适用法律时产生了诸多争议,这其中就包括行政协议撤销的法律适用问题。我国当前并未有关于行政协议的专门立法,在司法实践中,法院审理行政协议撤销案件时通常适用《行政诉讼法》之中关于单方行政行为撤销的依据以及《合同法》中关于民事合同的撤销依据。当前,争议的主要焦点在于能否运用《行政诉讼法》中撤销单方行政行为的第七十条六款情形撤销行政协议。本文从行政协议的性质入手,
一、前言排气量是压缩机的基本参数。也是合成氨厂装置能力计算的一个关键参量。安装良好的新机器,在运行中的实际排气量与规定值的差异反映了它的设计、制造水平,因而是评定
造血干细胞(hemopoietic stem cells,HSCs)是一类多能的、具有自我增殖分化能力的原始造血细胞,其生长及生理功能的发挥依赖于造血微环境。造血细胞及其微环境之间相互依存,
地球科学是一门实践性科学,实践教学在人才培养过程中具有至关重要的作用。本文系统介绍了西北大学地质学系十余年来在野外实习、课程实习实验及课间实习等实践教学领域的系
<正>多酚是分子内含有多个与一个或几个苯环相联的羟基的一类化合物的总称。它存在于陆生植物中,是其代谢产物。多酚参与植物生长繁殖过程,赋予植物无彩缤纷之色,调和酸甜苦