基于图卷积网络的人体行为识别和预测研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:li452546674
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能终端的不断普及和发展,视频已成为当今主流的媒体传播形式。由于人体行为是事件发展的主体,对于人体行为的识别和预测是基于计算机视觉的视频理解和分析的重点。与RGB图像相比,人体的骨骼关节点可以很好地描述人体行为,而且骨骼数据对于复杂的背景和相机的视角变化具有很好的鲁棒性。针对人体骨骼数据这种非欧几里得数据,如何利用图卷积网络提取丰富的时空特征是构建人体行为识别和行为预测模型的关键,也是课题来源的国家自然基金项目的研究重点。本文的具体研究内容分为以下两个部分:针对空域图卷积聚合关节特征的计算复杂且无法有效获取双手等远距离关节的空间关系的问题,论文提出了一种基于可分离谱图卷积网络的人体行为识别算法。首先论文根据人体的物理结构设计了静态图,通过关节运动信息推导全局响应的动态图,然后重新推导一阶可分离谱图卷积操作聚合人体关节点的全局和局部空间特征;其次,论文引入了可分离门控时间卷积模块关注关节运动信息来自适应调整时间卷积的感受野范围,使网络能够学习行为序列中可判别的时域信息;最后,论文使用跨模态识别方法解决了图卷积网络过拟合问题。在公开的数据集上的实验表明,本文提出的方法达到国际领先水平。针对基于RNN的循环预测网络没有很好利用身体关节的空间约束关系和运动信息的问题,论文提出了一种基于多分支图卷积网络的人体行为预测算法。首先论文设计了全局时空图和多尺度混合时间卷积模块编码不同时间步长的行为特征,并构建多分支图卷积网络的编码器,通过关节的空间位置和速度信息同步获取人体的时空特征和运动信息;其次,在解码器模块中论文引入了基于图的门控循环单元来递归预测人体行为,利用残差连接和关节的运动信息来稳定行为预测的结果;最后论文使用时间权重均衡损失函数来更多地关注早期时间步长的预测,鼓励网络在早期阶段实现更精准的预测,减少误差累积。
其他文献
无人机由于其低成本,易部署和通信链路可靠等优势,成为实现应急通信、热点区域覆盖等作用的有效技术之一。在热点覆盖场景中,存在大量重复请求的多媒体内容分发需求,大量内容传输与通信资源受限的矛盾导致无人机辅助蜂窝网络的传输能力难以满足用户需求。针对其中热点内容重复请求的情况,无人机部署存储设备缓存热点内容,从而有效卸载无线回程链路的流量并满足用户对低内容传输时延的需求。此外,无人机的移动特性使得无人机通
伴随着以5G和云为代表的数字化浪潮,移动和物联网设备爆发式增长,移动通信网络的规模和复杂性持续加大,IPv6凭借其充足的地址空间、端到端的对等通信服务、内嵌的安全机制等优势,为移动通信带来了无限的发展空间。在国家发展战略和产业自身发展需求的背景下,大量移动应用程序向兼容IPv6的方向迁移,移动应用程序的IPv6升级改造在提高用户体验、增强数据安全以及推动IPv6规模化部署等方面具有重要意义。然而,