【摘 要】
:
随着计算能力与深度学习技术的飞速进步,基于视觉信息的人体姿态识别在诸多领域具有广阔的应用前景,但受光照变化、相机运动等问题的影响,基于RGB视频图像直接对动作进行识别的效果并不理想,因此如何精准高效地进行人体姿态识别是目前亟需解决的问题。本文基于RGB视频首先进行人体姿态估计,进一步基于提取到的人体骨架序列进行动作识别,主要研究内容如下:分析总结了人体姿态估计和动作识别模型的发展,研究了人体姿态识
论文部分内容阅读
随着计算能力与深度学习技术的飞速进步,基于视觉信息的人体姿态识别在诸多领域具有广阔的应用前景,但受光照变化、相机运动等问题的影响,基于RGB视频图像直接对动作进行识别的效果并不理想,因此如何精准高效地进行人体姿态识别是目前亟需解决的问题。本文基于RGB视频首先进行人体姿态估计,进一步基于提取到的人体骨架序列进行动作识别,主要研究内容如下:分析总结了人体姿态估计和动作识别模型的发展,研究了人体姿态识别相关技术基础,包括2D人体姿态估计方法中自顶向下和自底向上两种方法及其差异、用于动作识别的图神经网络、用于处理时间序列信息的Transformer网络,以及姿态估计和动作识别相关数据集。研究了2D人体姿态估计中的代表算法,总结Open Pose算法、Alpha Pose算法以及Lite-HRNet算法,在公开数据集上实验,进行性能对比分析,结果表明Open Pose算法在推理速度方面具有一定优势,Alpha Pose推理结果准确度更高,Lite-HRNet在精度略微损失的同时可以兼顾推理速度和精度,本文最终选定LiteHRNet模型对动作视频进行骨架序列提取。研究了基于骨架数据的动作识别,在ST-GCN算法基础上,将固定结构的骨架图改为由样本数据驱动的自适应图,通过自适应的连通图实现不同样本在不同层个性化地表达节点连接关系,增加空间图卷积过程的灵活性和通用性。之后提出一种结合残差通道注意力机制的自适应空间图卷积结构以增加节点关键特征的表达能力,引入关节点二阶速度信息与空间位置信息进行组合加强,算法效果在NTU RGB+D数据集上进行测试,在x-view和x-sub基准下,准确率分别提升到94.5%和87.3%。研究了自适应时空图卷积网络结合Transformer网络,对动作序列中多帧间的长程时间相关性进行特征提取。结合使用TCN(Temporal Convolutional Network)和Transformer网络在整个模型中同时提取局部及长程时间特征,对整个动作序列中节点之间的时间相关性进行更加准确地建模,融合Transformer网络可以在保证模型准确性的同时降低模型计算复杂度,算法效果在NTU RGB+D数据集上进行测试,以约1/7的计算复杂度在x-view和x-sub基准下,准确率分别达到93.9%和85.0%。
其他文献
中段弹道飞行是各种导弹防御系统的研究重点,动能拦截器的发展已达到精细化、精确化的程度, 对弹道导弹中段突防技术提出挑战。针对动能拦截器的拦截与弹道导弹中段机动突防问题,本文研究一种新的拦截器-突防弹机动策略,分别研究在突防弹不机动情形下,拦截器拦截成功的策略以及突防弹机动情形下,突防弹突防成功的策略。在拦截器和突防弹的速度矢量平面内构建攻防对抗模型,基于动力学原理和奇异摄动理论,使用两种不同的脱靶
网上教务管理系统是现代远程教育平台的核心组成部分,是现代教育技术的重要应用领域和远程教育质量和效率、效果的重要保证。鉴于目前一些的远程教育平台,教务管理模块没有真正实现按需开发(R&D on-demand)的缺陷,本文针对"网上北语"教学教务管理工作实际需要,从直接系统用户的角度,面向实际应用开发系统分析工作,从提高工作的效率和现代化程度出发,着重采用软件工程的分析研究方法,对于分布式、交互式网上
<正>随着跨区作业在各地逐步展开,履带式谷物联合收获机市场的激战持续已久。而2022年的水稻机市场上,又闯入了一批黑马,而且还是跨界而来的黑马,就是徐州徐工农业装备科技有限公司。与进军拖拉机市场策略相似,徐工在履带式谷物收市场也是选择了当前市场主导产品,即6、7 kg/s喂入量机型进入。
伴随经济的迅猛发展,人们的精神文明需求日益提升,时尚的服装是人们追求的重要目标之一。所以,服装设计备受人们的重视,直接促进了服装设计行业的不断发展,从而大胆而创新的设计作品层出不穷,由各种颜色、面料等所拼接而成的服装同样在逐渐的推陈出新。本文就拼接手法在服装设计中的运用进行深入的探讨。
直播行业的井喷式发展,使消费者在面对信息爆炸时代,难以快速获取有价值的信息,由此促使“网红+直播”的产生。在直播带货情境中,消费者具有“被动消费”的特征,消费者的购买欲望主要是通过即时的事件刺激或心绪的改变得到激发和满足,其中,消费者会受到及时性、专业性、娱乐性和互动性等多方面的影响,更容易激发冲动性购买。然而,多主体的交流互动和分享、主播个人魅力的感知也能够为消费者提供更丰富的刺激,为冲动购买创
<正>近日,中共中央办公厅、国务院办公厅印发《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》,正式明确"双减"政策并主动规制校外培训机构的无序发展。"双减"政策下,中国教育将走向何方?"双减"政策出台的动因"双减"政策落地并非一蹴而就,其背后有着深刻的社会经济动因。当前,宏观人口结构和人口政策变化、群体间收入差异扩大、高等教育扩张和内部分化,影响了我国教育发展的走向。
介绍了一种基于工程软件草图的民机典型货舱门打开驱动机构方案设计方法,包括机构原理草图的创建、四杆机构及虚拟铰链机构载荷快速分析计算、机构全行程载荷提取,以及基于受力分析结果的机构方案优化等内容。本设计方法可以实现概念设计阶段机构方案的快速优化,为民用飞机舱门打开驱动机构设计提供了参考。
城市为保障供水需求设置应急备用水源,如何确定应急备用水源用水分类,如何计算相应分类的用水量、合理确定供水规模方可最大程度满足各方用水需求,以及如何进行调度计算以提高水资源利用率,是提出应急备用水源联调方案的目的。以黄岩区应急备用水源联调为例,区别于传统灌溉、生态环境、生活等用水分类方式,分析归纳为应急用水、备用水、补充用水和水库现有供水区用水4种用水类型,根据不同目标对应急备用水源的用水量细化分类
桅杆是履带式起重机下车与上车间的重要连接部件。利用三维建模软件和有限元分析软件对桅杆进行建模、仿真,研究桅杆在最危险工况下的应力分布情况。应力分布结果表明,桅杆头部存在应力集中现象,为消除应力集中带来的不良影响,对桅杆头部结构进行结构改进,改进后结构无应力集中现象,工艺性好,满足结构强度要求的同时实现了结构的轻量化。
针对红烧鹅菜肴的工业化加工,研究预煮条件(预煮时间)、油炸条件(油炸温度、油炸时间)、灭菌条件(灭菌温度、灭菌时间)对菜肴品质(色泽、蒸煮损失、质构、感官等)的影响,并对工艺条件进行研究比较,筛选最佳工业化红烧鹅加工工艺,并对产品品质进行评价。结果表明,最佳工艺条件为预煮时间20 min、油炸温度120℃、油炸时间180 s、灭菌温度121℃、灭菌时间50 min。在此条件下,红烧鹅的感官评分为8