基于深度特征建模的人体行为识别与检测研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:heaweawelf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别近年来发展迅速,已经成为计算机视觉领域的热点问题,其目的在于分析理解视频内容,并识别出目标人物的动作类别。人体行为识别广泛应用于汽车自动驾驶、人工智能机器人、无人零售以及安防监控等领域。然而,由于视频背景的复杂性、光照变换以及相机运动等外在因素,以及人体运动多变性等内在因素,使得基于视频的人体行为识别任务的研究充满挑战。传统的行为识别算法主要依赖人工提取的标准特征,计算量大且时效性低。近年来,基于深度学习的行为识别算法已经成为主流,大部分算法都采用双流网络(Two-Stream)结构对视频的空间和时间特征进行学习。然而由于光流信息的语义不明确和数据冗余等问题,使得深度网络模型在处理复杂视频内容时在计算和特征层面存在着一定局限性。本文重点研究在不使用额外运动信息的情况下,利用卷积神经网络(Convolutional Neural Network,CNN)和长短期记忆网络(Long Short-Term Memory,LSTM)挖掘视频中的判别信息,对视频中的人体运动进行分析与理解。本文主要工作如下:(1)本文提出了一种基于判别语义特征学习的深度人体行为识别算法。首先通过上下文注意驱动运算学习不同帧之间的语义信息的权重,利用端到端的深度网络实现判别信息的提取。其次利用双向LSTM可以使用视频前后帧的上下文信息这一特性,替代双流网络,进行长时建模,并推断全局判别信息之间的时序关系。最后使用时序关系推理网络,通过模拟人脑推理机制,来推理局部判别信息之间的相关性。实验结果显示,本文设计的判别特征提取深度框架在基准数据集UCF101和HMDB51下的识别准确率分别为95.8%和72.0%。(2)本文提出一种基于分级特征网络的时序行为检测算法,即对未剪辑的视频数据进行动作识别并定位。网络分为两个部分:a)行为分类网络,利用深度残差网络(ResNet-101)搭建双流网络(Two-Stream),分别输入视频序列的图像帧和相应堆叠光流,以学习各个图像帧中运动的得分,并通过该得分产生初始行为建议;b)坐标回归网络,利用粗粒度将分类网络中生成的初始建议划分成固定尺度的单元块,通过单元特征构造特征金字塔,并利用时序坐标回归细化建议边界,最终得到稳定准确的行为边界。
其他文献
新中国成立70年来,随着经济、社会等各个领域的深刻变化,我国社会主义意识形态也在内容体系、话语体系、功能定位等多方面经历了一系列变化和"转型"。而我国社会主义意识形态
在分析工作原理和动力学的基础上,通过优化计算得到剪叉式液压升降台主设计参数。基于剪叉式液压升降台的主要设计参数,分别采用Solidworks和ADAMS建立剪叉式液压升降台的三
减负,难在找准“病灶”,贵在“靶向”精准。知屋漏者在宇下,知政失者在草野。基层之“负”在哪里?减负有哪些“拦路虎”?基层干部群众体会最深,也最有发言权,他们的切身感受,便是找准
报纸
在科学技术高度发展的今天,电几乎进入人们生产和生活的所有领域。人们离不开电,也不得不重视电气安全。我们作为教育工作者亦深知电气安全教育、科研实践以及管理重要性。由
抖音是今日头条旗下的一款音乐类社交短视频软件,截止到2018年10月抖音的日活跃用户突破2亿,月活跃用户突破了4亿,持续高速增长的态势迅速激活了短视频行业的市场潜能,也引发了业界和学界对抖音的极大关注。抖音通过大数据分析和智能分发的推荐机制“投其所好”,在不同的场景中创造出不同的需求,让每一个用户都能在不同的场景下“各取所需”。但也正因如此,抖音在智能科技的加持和商业价值的裹挟下,场景化传播行为产
目前,我国经济发展形势越来越好,企业对于投融资的需求不断提高。但危险与机遇并存,企业面临的问题也很多,因此对企业投融资决策做好系统理论的指导工作十分重要。要想有效提
【研究背景】水稻胡麻斑病又称水稻胡麻叶枯病,是由稻平脐蠕孢菌(Bipolaris oryzae)所致的一种水稻真菌性病害。随着干旱变得越来越频繁,水稻胡麻叶斑病正变得越来越频繁和严
<正>2011年3月响应医院的号召,进行了优质护理示范病房的创建。为了更好地为病人提供优质服务,办政府满意、社会满意、病人满意的医院,我科于同年9月采取了一系列举措,借优质
会议