论文部分内容阅读
近年来,人体行为识别技术广泛应用于视频监控、智能医疗教育、无人驾驶、日常行为分析等方面,在安防领域扮演着举足轻重的角色。军事上,行为识别技术已应用于军事化研究基地、国防边境、哨所等戒备森严的军事重地,通过检测区域内可疑行为,为环境感知及决策者远程决策做出贡献。
尽管基于深度学习的人体行为识别技术已取得了很多成果,但仍存在基于RGB视频的模型严重依赖物体和场景、行为特征表达不够合理等问题。针对上述问题,本文利用人体骨架的自然连接关系,构建基于时间-空间图卷积网络的行为识别模型,实现入侵检测、奔跑、投掷及徘徊等人体行为识别。本文主要研究内容包括以下几点:
(1)利用多人姿态估计方法提取人体骨架信息
本文利用自顶向下框架的多人姿态估计方法,提取视频中人体骨架信息。针对遮挡、场景变化时人体关节点检测精度有待提高的问题,本文基于残差网络结构与多个瓶颈结构设计,在困难关节点检测过程中加入更多上下文语义信息,并利用在线难例挖掘算法改善网络对困难样本的关注度,从而提高困难关节点的检测精度。针对人体目标检测框定位不准确、模型实时性有待提高等问题,本文基于对称空间变换网络加入了闭环结构用来反馈误差信息,改善网络提取人体提议框的能力,并在单阶段目标检测网络中加入深度可分离卷积,提高模型运行速度。
(2)利用多人姿态跟踪方法绘制目标运动轨迹曲线
本文利用自上而下框架的多人姿态跟踪方法,完成在线多人姿态跟踪,以跟踪准确率最高的人体关节点作为人体ID,绘制运动轨迹曲线。并利用轨迹长度、轨迹方向角及运动速度等特征,建立徘徊、逗留等行为识别模型。针对在线姿态跟踪速度慢、易出现漏检、姿态估计错误等的问题,本文基于ORB算法计算帧间姿态距离,有效提高了特征点检测与匹配速度,并融入交叉帧检测实例共享时间信息解决上述问题。
(3)利用时间-空间图卷积网络构建人体行为识别模型
本文基于人体骨架数据,构建基于时间-空间图卷积网络的行为识别模型。针对非欧几里得数据无法使用传统卷积方式操作的问题,利用图论相关理论,构建姿态拓扑图,基于空间域的方法将图结构数据转换为邻接矩阵完成卷积操作,提取人体姿态空间特征,并利用时间卷积网络提取人体姿态时间特征。针对人体关节点在动作产生过程中的注意力权重值不同,建立了时间-空间注意力模型,提高行为识别准确率。
本文人体行为识别技术研究中针对上述几个重要问题,给出了相应的解决方案,同时在各个数据集上对本文设计模型进行了测试及实验分析。结果表明,本文模型在对应数据集中达到了较高准确率,算法的有效性得到了验证。
尽管基于深度学习的人体行为识别技术已取得了很多成果,但仍存在基于RGB视频的模型严重依赖物体和场景、行为特征表达不够合理等问题。针对上述问题,本文利用人体骨架的自然连接关系,构建基于时间-空间图卷积网络的行为识别模型,实现入侵检测、奔跑、投掷及徘徊等人体行为识别。本文主要研究内容包括以下几点:
(1)利用多人姿态估计方法提取人体骨架信息
本文利用自顶向下框架的多人姿态估计方法,提取视频中人体骨架信息。针对遮挡、场景变化时人体关节点检测精度有待提高的问题,本文基于残差网络结构与多个瓶颈结构设计,在困难关节点检测过程中加入更多上下文语义信息,并利用在线难例挖掘算法改善网络对困难样本的关注度,从而提高困难关节点的检测精度。针对人体目标检测框定位不准确、模型实时性有待提高等问题,本文基于对称空间变换网络加入了闭环结构用来反馈误差信息,改善网络提取人体提议框的能力,并在单阶段目标检测网络中加入深度可分离卷积,提高模型运行速度。
(2)利用多人姿态跟踪方法绘制目标运动轨迹曲线
本文利用自上而下框架的多人姿态跟踪方法,完成在线多人姿态跟踪,以跟踪准确率最高的人体关节点作为人体ID,绘制运动轨迹曲线。并利用轨迹长度、轨迹方向角及运动速度等特征,建立徘徊、逗留等行为识别模型。针对在线姿态跟踪速度慢、易出现漏检、姿态估计错误等的问题,本文基于ORB算法计算帧间姿态距离,有效提高了特征点检测与匹配速度,并融入交叉帧检测实例共享时间信息解决上述问题。
(3)利用时间-空间图卷积网络构建人体行为识别模型
本文基于人体骨架数据,构建基于时间-空间图卷积网络的行为识别模型。针对非欧几里得数据无法使用传统卷积方式操作的问题,利用图论相关理论,构建姿态拓扑图,基于空间域的方法将图结构数据转换为邻接矩阵完成卷积操作,提取人体姿态空间特征,并利用时间卷积网络提取人体姿态时间特征。针对人体关节点在动作产生过程中的注意力权重值不同,建立了时间-空间注意力模型,提高行为识别准确率。
本文人体行为识别技术研究中针对上述几个重要问题,给出了相应的解决方案,同时在各个数据集上对本文设计模型进行了测试及实验分析。结果表明,本文模型在对应数据集中达到了较高准确率,算法的有效性得到了验证。