【摘 要】
:
随着计算机计算能力的提高和相关数据集的愈加丰富,深度学习在计算机视觉领域的图像分类、语义分割、目标检测等任务上取得了巨大的成功。在视频动作识别任务中,一些主流的卷积神经网络架构已经取得了良好的性能。但是这些常用的网络结构不能很好的学习视频中的上下文信息和视觉属性,这就使得这些深度学习算法对视频图像中具有重要影响作用的区域或信息建模不足。另外动作在视频中的发生时间是不固定的,如何有效地将网络的注意力
论文部分内容阅读
随着计算机计算能力的提高和相关数据集的愈加丰富,深度学习在计算机视觉领域的图像分类、语义分割、目标检测等任务上取得了巨大的成功。在视频动作识别任务中,一些主流的卷积神经网络架构已经取得了良好的性能。但是这些常用的网络结构不能很好的学习视频中的上下文信息和视觉属性,这就使得这些深度学习算法对视频图像中具有重要影响作用的区域或信息建模不足。另外动作在视频中的发生时间是不固定的,如何有效地将网络的注意力放到有动作的区域,这一个需要视频动作识别中解决的问题,本文针对基于视频的人体行为识别方法中出现的一些问题进行研究,论文的主要研究内容包括:首先,为了准确检测视频中的异常行为,本文提出了一种基于生成对抗网络的模型。模型首先通过一个生成器对未来的帧进行预测,然后通过判别器将生成的预测帧和真实的帧进行比对,根据比对的结果判断是否出现了异常行为。但是生成对抗网络的训练难度较大,并且生成的图像有时候会出现失真严重,这就导致图像的生成失去了意义,更严重的是会出现模型崩溃的现象。所以本文采用了Wasserstein生成对抗网络,另外考虑原始生成对抗网络的固有缺点,模型仍然无法达到非常好的效果,所以特地引入了条件生成对抗网络,引入光流对模型的运动信息进行约束。在提取光流特征方面,选择当前性能较好的Flownet网络对视频中的场景进行光流提取。将上述改进后的生成对抗网络与变分自动编码器相结合,利用变分自编码器提取特征,对VAE和GAN进行联合训练。充分发挥二者在特征提取和生成性能方面的优点,获得的了更好的效果。通过引入条件生成对抗网络的特性,还可以实现对预测帧生成过程的人为控制,进而提出了本文的模型。最后,本文介绍了视频分析系统主要功能模块的实现,并对其功能进行了测试。通过对这些结果的分析,视频分析系统能够满足对异常行为进行检测的需求,具有很强的工程价值和实用价值。
其他文献
惊风是小儿常见的急症,可发生在许多疾病的过程中,临床以抽搐并伴神志障碍为特征。古代将惊风的证候表现归纳为四证八候:四证是疾、热、惊、风;八候为搐、溺、颤、掣、反、引、窜
当前我国粮食安全的总体形势是好的,但仍存在一些影响粮食安全的不利因素,需要从生产、流通、消费等不同领域采取更有针对性、更有力度的综合措施来确保国家粮食安全。
背景:伤口处细胞外基质中高含量的透明质酸对瘢痕形成有抑制作用,胚胎皮肤切口呈现无瘢痕愈合,但对于胎儿皮肤中透明质酸的含量未见报道。目的:观察胎儿颌面部皮肤中透明质酸
在大力推进农村饮水安全工程建设中,集中式饮用水水源地水质管理和保护尤为紧迫而重要。不少地方坚持一手抓农村饮水安全工程建设,一手抓水源地保护,以此提高饮水安全民调满意度
ATP合酶(F0F1-ATPase)广泛分布于生物体内,是能量代谢的关键酶。它是一个多亚基复合体,按照极性ATP合酶(F0F1-ATPase)可分为在膜外亲水部分和结合于细胞膜上的疏水部分,这一特性
1.泥土粘着并堵塞刀盘 产生原因: 盾构机在粘性土层中施工时,由于粘性土具有内摩擦角小、粘性大和流动困难等特点,使得粘性土体粘附在刀盘上。被刀盘从开挖面上切削下来的粘
孟称舜的《娇红记》是继《牡丹亭》之后的一部有划时代意义的爱情剧。无论是其崭新的思想观念,还是其强烈的艺术感染力,都给人留下了深刻的印象,他采用悲剧来表现现实人生,与
<正>《双城记》A TALE OF TWO CITIES红历49年,布面油画1998,Oil on Canvas对联100cm×240cm×2ps couplet[题画诗]:独有英雄驱虎豹,更无豪杰怕熊罴——《七律·冬云》Only h
目的探讨肥厚型心肌病患者晕厥发生的相关危险因素。方法入选肥厚型心肌病患者,所有患者进行为期2年的随访,根据是否发生晕厥分成有晕厥组和无晕厥组两组,比较两组的临床特征
国内煤矿项目的环境影响后评价尚处于起步和探索之中,环境保护部目前选取了少数几个代表性的煤矿开展了环境影响后评价。文章结合在试点煤矿开展环境影响后评价工作的情况,论