【摘 要】
:
人体行为识别是给计算机输入一段视频或者图像序列,根据提取出的视频特征,对视频中人体所做出的行为进行分类。人体行为识别作为视频理解的核心技术,在场景监控,信息检索等实际场景中具有广阔的应用前景和重要的社会价值。随着深度学习的发展,基于深度学习的行为识别方法受到了国内外学者的广泛关注。目前,双流卷积神经网络是基于深度学习的人体行为识别研究的重要方法之一。双流卷积神经网络分为空间流和时间流两个组成部分,
论文部分内容阅读
人体行为识别是给计算机输入一段视频或者图像序列,根据提取出的视频特征,对视频中人体所做出的行为进行分类。人体行为识别作为视频理解的核心技术,在场景监控,信息检索等实际场景中具有广阔的应用前景和重要的社会价值。随着深度学习的发展,基于深度学习的行为识别方法受到了国内外学者的广泛关注。目前,双流卷积神经网络是基于深度学习的人体行为识别研究的重要方法之一。双流卷积神经网络分为空间流和时间流两个组成部分,时间流提取的行为运动信息作为空间流提取的行为外观信息的补充,有效的提高了行为识别的准确率。但是,双流卷积神经网络中空间流和时间流均采用单一大小的卷积核,无法捕获到复杂视频环境中不同尺度的物体,对部分易混淆行为存在误判。本文针对这一问题展开研究,完成的主要工作如下:1.针对双流卷积神经网络无法提取视频中多尺度特征的问题,提出了基于多尺度双流卷积神经网络的人体行为识别算法。通过把金字塔型卷积分别运用到空间流和时间流中,增强了单支流对不同尺度物体的识别能力。金字塔型卷积采用不同大小卷积核捕获多尺度信息,实现了多尺度识别,提高了行为识别的准确率。2.针对神经元不能自适应选择卷积核大小而导致不同尺度物体识别率低的问题,提出了融合注意力机制的多尺度双流神经网络识别算法。该算法利用通道间的注意力机制融合不同大小卷积核输出的特征图,进一步将不同尺度的信息进行融合。同时,针对通过通道特征向量进行降维获取注意力权重的方法会带来信息损失,提出了通过一维卷积的方式避免对通道特征向量进行降维,使获取的注意力权重更加精准,另外根据卷积核分支的数量,通过多次一维卷积生成不同卷积核的特征向量学习注意力权重的方式相比于共用一个特征向量学习注意力权重的方式,提高了卷积核的独立性,降低了耦合性,进一步提高了识别准确率。本文通过在UCF-101数据集上进行实验并对结果进行分析,验证了本文方法的有效性。
其他文献
锂及其化合物被广泛应用于工业领域中,我国市场对锂的消费量和需求量逐年递增,开发新的锂矿源尤为重要。在我国铝工业生产中,大量含锂的铝土矿被开采并用于制备冶金级氧化铝,在铝电解槽长时间运行后,锂元素因在电解质中难以析出而富集。从富锂铝电解质中提锂,不仅可以补充市场对锂资源的需求,也可以实现富锂铝电解质的资源化利用。在盐湖提锂技术中,尖晶石型锂离子筛H1.6Mn1.6O4是目前具有良好发展前景的离子交换
等规聚丙烯(iPP)具有良好的物理、化学和加工性能,广泛应用于日常生活、包装材料、汽车内饰等各个领域。但韧性差、低温脆性大等缺点严重制约了iPP的进一步发展和应用。幸运的是,iPP的多晶型特性赋予其极大的性能可调控性。添加成核剂是工业生产中改变iPP晶型最为简便的方法,其中稀土成核剂(WBG-Ⅱ)的应用最为广泛。为了实现iPP的高性能化和功能化,除了成核剂,往往会在iPP中添加第二相填料(例如氧化
背景听力损失(Hearing Loss,HL)是最常见的致残性疾病之一,占各类残疾的33%,严重影响人类的正常认知和交流,给患者及其家庭乃至社会造成了巨大的精神和经济负担。前庭导水管扩大(Enlarged Vestibular Aqueduct,EVA)是中国感音神经性耳聋儿童中最为常见的内耳畸形,SLC26A4基因变异在中国耳聋人群中检出率居第二位,仅次于GJB2基因,SLC26A4基因变异造成
螺栓在装配后会出现松动的情况,影响钢结构建筑、机械装备、航空器等设备的运行安全。目前关于螺栓连接状态的监测研究主要是利用压电陶瓷片或者压电探头等传感器进行监测,该方法单点激励、单点接收信号,受噪声以及环境温度的影响,可能对判定螺栓连接状态造成影响,并且对于某些边缘狭窄的零部件,不能布置压电传感器,从而无法检测。为解决上述问题,本文提出利用激光超声监测螺栓松动的方法。利用激光的扫描系统实现了被检测试
随着现代社会的发展,能源危机和环境污染两大问题已经成为提高人类生活水平的“绊脚石”。因此,开发清洁、丰富的能源取代传统化石燃料,同时减少有害气体排放是广大科学研究者目前要攻克的难题。氢能,因其能量密度高、环境友好等特点而受到广泛关注,如何高效地制备氢能成为当前科学研究的前沿。半导体光电催化(PEC)分解水制氢是一种极具前景和吸引力的太阳能捕获和存储技术。PEC分解水过程包含阳极的析氧反应(OER)
随着经济社会的不断发展,我国在电力供应方面的需求量迅速上升,对电网的智能化水平提出了很高要求。变电站作为输变电体系中的重要组成部分,其核心设备的状态判别和故障事件的及时发现、决策与处理是保障电力系统正常稳定运行所需解决的关键问题。变电站设备运行状态复杂,故障类型和原因多样,出现设备故障时,通常波及众多相关装置和设备,但由于监控系统能够捕获的故障信息不完整、故障数据之间相关性弱,仅通过运维人员来发现
近年来,“毒驾”导致的交通事故呈上升趋势,严重威胁人民生命财产安全和交通道路安全。由于临时道路毒检形成的试纸图像受室外环境影响较大,常常因光照不均匀、试剂弱反应状态引起毒检试纸图像存在阴影、伪影等情况,产生图像弱边界问题,导致采用常规图像识别技术无法得到准确结果。因此,本文以临时道路毒驾检测为应用背景,对弱边界毒检图像的识别与分类展开研究。针对实际场景下毒检试纸图像的特点,将图像识别过程按模块划分
在智能手机的生产过程中,表面缺陷检测是不可或缺的一部分。针对当前手机生产过程中,人工缺陷检测成本高、效率低等问题。本文设计并实现了一款基于机器视觉的智能手机表面缺陷检测系统。根据不同的功能需求分为了表面缺陷检测模块、图像标注模块、深度学习模型训练模块。针对这三个模块,本文的主要研究工作包括:1.针对智能手机表面缺陷检测的具体需求,结合传统图像缺陷检测方法和深度学习目标检测算法设计并实现了表面缺陷检
随着互联网技术的蓬勃发展,人们的生活越来越便利,但与此同时,网络安全问题也随之而来,严重影响着网络的应用及各类用户的安全,因而对网络安全技术进行研究至关重要。入侵检测技术是一种主动式的防护技术,通过实时监测、收集和分析网络流量包,并在系统受到危害前识别和拦截攻击行为,能够高效保护网络系统的安全。论文通过分析NSL-KDD数据集的数据分布并联系实际情况,将网络入侵检测简化为二分类问题,即正常行为和攻
细胞的伸长在棉花的整个生长发育阶段过程都发挥着不可忽视的作用。调节细胞的伸长可调控株高,对缩短棉花果枝,降低果枝始节位有重要的作用。另外细胞的伸长在棉花的纤维发育过程也发挥不可替代的作用。本研究以GhAIFs家族基因为研究方向,得到以下结论:1.在亚洲棉、雷蒙德氏棉、陆地棉和海岛棉中分别鉴定了8个、11个、16个和15个AIFs基因,系统进化树将AIF基因分为3个亚家族。基因复制事件分析表明AIF