基于压缩域的视频动作识别研究

来源 :中南民族大学 | 被引量 : 0次 | 上传用户：naomi

【摘要】

：

【作者】

：

江凯华

【机构】

：

中南民族大学

【出处】

：

中南民族大学

【发表日期】

：

2021年01期

【关键词】

：

压缩域动作识别卷积神经网络双流网络

【基金项目】

：

国家重点研发计划项目（编号:2020YFC1522600）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

视频动作识别技术是人工智能领域中的热点研究课题,其目的在于分析视频中人体动作并将其正确分类,已广泛应用于安防监控等领域。按输入视频类型划分,视频动作识别算法可分为压缩域和像素域（非压缩域）算法。其中,压缩域动作识别算法一般比像素域动作识别算法的计算量更小,这是因为视频编码过程中,去除了视频的时间和空间冗余,使网络更容易获取人体运动相关信息。相比于像素域,压缩域动作识别算法也存在信息量不足、识别精度低等缺点。就现有压缩域动作识别算法而言,使用运动矢量替代光流可降低模型计算量,但运动矢量的动作表征（Motion Representation）能力弱于光流。同时,现有压缩域动作识别算法使用2D网络获取运动时序信息的能力有限,影响识别精度。针对这些不足,本文分析了现有压缩域动作识别算法,并提出改进算法,具体研究内容如下:1、针对压缩域运动矢量和残差存在噪声干扰,以及低分辨率等缺点,本文分析了压缩视频在动作识别任务的优势后,设计了一种基于压缩域运动矢量和残差的融合信息。该融合信息降低运动矢量噪声,提高运动目标精度,使网络更专注于运动目标区域,丰富了网络输入的多样性。在该过程中,模型利用视频帧的时间连续性和空间紧凑性,去除运动矢量与残差的干扰噪声（如背景、孤立值等）;同时以通道叠加的方式融合运动矢量与残差,增强了压缩域融合信息表征人体动作的能力;最后进行消融实验,并分析实验结果。实验表明,与压缩域动作识别算法CoViAR相比,在计算成本相当的情况下,本文算法的识别精度更高,证明了该融合信息在动作识别中的有效性。2、针对现有压缩域动作识别模型获取运动时间信息能力有限,进而影响识别精度的缺点。本文在高效卷积网络ECO基础上,设计了一种基于压缩域信息的双流网络视频动作识别模型。该模型以I帧和压缩域融合信息作为网络输入,代替像素域RGB与光流,而无需预先计算光流,降低了模型的整体计算成本;同时以多维度信息输入,提升模型的识别性能。实验表明,本文算法的识别精度比压缩域动作识别算法DMC-Net/MFCD-Net的识别精度更高,同时在计算成本上远远低于I3D算法,也验证了本文算法的识别效果。

其他文献

鸣鸠琴进课堂调查研究 ——以成都市金牛区两所初中学校为例

学位

恢复性环境色彩感知对游客满意度的影响研究 ——以大连老虎滩海洋公园为例

学位

车辆路径问题的蚁群算法研究

学位

周思聪笔下的周总理

学位

智慧课堂条件下的初中音乐教学实践研究 ——以成都市L中学为例

学位

初中音乐课《春江花月夜》三版本课堂教学研究 ——以一师一优课获奖课例为典型数据

学位

成都市高中音乐模块教学现状调查研究 ——以市属两所学校为例

学位

王冕墨梅诗画融合研究

学位

地方音乐文化资源在高中音乐校本课程中的开发应用 ——以祭孔乐舞为例

学位

不同条件下硫酸盐还原菌对驱油聚合物粘度的影响

采用测试聚合物溶液粘度损失的方法,研究不同条件下SRB对驱油聚合物粘度影响。分别改变温度、pH值、聚合物浓度和细菌浓度,测试溶液粘度变化。结果表明:当温度为40℃下,聚合物粘度下降最大。当溶液pH值为8时,粘损最高。随着聚合物浓度的增加,溶液粘度下降最大,当浓度为600mg/L时,粘度最小。细菌浓度为10~5个/ml时,细菌对聚合物溶液粘度影响最大。

期刊

聚合物硫酸盐还原菌粘度温度pH值

基于压缩域的视频动作识别研究

其他学术论文