【摘 要】
:
图像中的手部检测和手势识别是计算机领域的重要部分,在许多计算机视觉应用中具有重要意义。由于手形状的多变性和图像背景的杂乱性,精确、快速的手部检测和手势识别仍然是一项具有挑战性的任务。为了提升复杂无约束场景下的手部检测和手势识别的准确率,解决检测速度仍然很难达到实时的问题,我们提出了两种基于深度学习的手部检测和手势识别方法,并在三个基准数据集Oxford手部数据集、Ego Hands数据集和Nati
论文部分内容阅读
图像中的手部检测和手势识别是计算机领域的重要部分,在许多计算机视觉应用中具有重要意义。由于手形状的多变性和图像背景的杂乱性,精确、快速的手部检测和手势识别仍然是一项具有挑战性的任务。为了提升复杂无约束场景下的手部检测和手势识别的准确率,解决检测速度仍然很难达到实时的问题,我们提出了两种基于深度学习的手部检测和手势识别方法,并在三个基准数据集Oxford手部数据集、Ego Hands数据集和National University of Singapore(NUS)手部姿态数据集以及自制数据集上进行了评估实验,主要研究内容包含以下两方面:(1)针对复杂无约束场景下的手部检测和手势识别准确率低的问题,我们构建了一种基于残差网络ResNet101和融合网络的全卷积网络模型RF-FCNet,该模型首先将ResNet101作为手部特征提取网络,然后通过融合反卷积网络和残差结构作为手部精确预测融合网络,生成多尺度手部特征图,并通过单一的卷积层实现手的检测和分类。在Oxford手部数据集上的实验结果表明,RF-FCNet模型的准确率m AP达到87.2%,优于其他先进的模型。在NUS手部姿态数据集上的实验结果表明,RF-FCNet模型的m AP高达99.2%,优于其他最新的模型。在三个基准数据集上的实验结果表明,RF-FCNet模型能够有效提升手部检测和手势识别的准确率。(2)针对手部检测和手势识别方法在检测速度上的研究较少或检测速度很难达到实时的问题,我们提出了一种基于轻量级网络SqueezeNet的手部检测和手势识别模型SF-FCNet。该模型在RF-FCNet的基础上采用轻量级网络SqueezeNet的前17层作为手部特征提取网络。利用SqueezeNet可以损失较少精度且大量减少模型参数的特点,使SF-FCNet在达到一定准确率的情况下,提升检测速度。在Oxford手部数据集上的实验结果表明,SF-FCNet可以达到84.1%的准确率和32 FPS的检测速度,优于其他手部检测模型,其中FPS大约是RF-FCNet的1.45倍。在NUS手部姿态数据集上的实验结果表明,SF-FCNet可以达到与RF-FCNet相同的检测精度,且FPS大约是RF-FCNet的1.41倍,证明了SF-FCNet能够显著提高手部检测和手势识别的检测速度,同时确保较高的准确率,具有一定的通用性和有效性。在自制数据集上的检测结果也表明了SF-FCNet具有较强的泛化能力和实用性。在基准数据集和自制数据集上的实验结果展示了所提的RF-FCNet和SF-FCNet在准确率和检测速度上均有优良性能,且适用于手部检测和手势识别两个不同任务,表明所提架构具有较好的通用性。
其他文献
GaN器件为高电子迁移率晶体管(HEMT)器件,它有AlGaN和GaN基器件,以其优异的电子迁移率、禁带宽度、高频、高温、大功率等特性,备受关注,在航空航天、计算机信号处理、雷达、电子通信等领域广泛应用。然而GaN器件的功率密度较大,发热源的温度较高,长期的高温会对器件的性能及可靠性造成影响。因此,对GaN器件的工作时的温升、热阻进行精确、快速检测分析成为科研和工业领域亟需解决的问题。随着GaN器
有机电致发光器件(OLED)和量子点电致发光器件(QLED)作为新型固态照明和平面显示技术,因具有低成本、自发光、色纯度高、制作简便、低功耗和可柔性等优点而备受关注,在照明和显示领域有着广泛的应用前景。然而常用作阳极的氧化铟锡(ITO)的功函数与有机功能层的HOMO能级之间存在较高的势垒,严重影响了空穴的注入。同时各功能层不同程度的老化也不利于器件寿命的提升。在当前低成本、大面积和精确可控量产等新
有机电致发光器件(OLED)由于其具有可弯曲折叠、节能环保、低功耗、低压驱动、自主发光等优势,在全彩显示照明领域具有极高的应用价值,被认为是21世纪的“显示之星”。其中具有短波发射的紫外(UV)OLED广泛应用于激发光源、高密度信息存储和生化传感等领域,同时极大的拓宽了光电器件的应用范围。然而,目前UV OLED技术还存在着许多问题亟待解决。如氧化铟锡(ITO,表面功函数为4.7e V)透明电极作
抗菌材料是一种帮助人们抵御疾病免受有害微生物侵害的功能性材料,但传统的抗菌材料抗菌成分单一,受环境因素影响较大,抗菌效果不理想。而复合抗菌材料因其具有化学稳定性,杀菌广谱性以及抗菌长效性等优势,是目前研究最为广泛的一类抗菌材料,现今已被广泛应用于食品安全、烧伤药物敷料、安全护肤品、仿生医疗、污水处理以及农牧业等领域。因此,本论文通过简便的合成方法,制备了多孔材料负载银基的复合抗菌材料,分析了其材料
随着国民经济的持续增长,我国城镇化进程迅速推进,居民的出行交通工具也呈现多样化。电动自行车因经济、节能、便捷的优点,逐渐成为我国居民出行重要的交通工具。电动自行车的发展有效弥补了我国短程出行的短板,但由于骑行者交通安全意识淡薄,缺乏专业的技能培训,诱发了系列安全问题,给城市交通管理和安全保障工作带来巨大压力。因此,需深入探究电动自行车风险骑行行为形成机理,从而制定针对性的改善对策。论文首先对影响风
日益严重的能源短缺和环境恶化促进了科研工作者对新能源的研究和利用。在当前能源危机的形势下,光伏技术和产业得到了迅速发展。到目前为止,传统的单p-n结太阳能电池由于其技术成熟和相对较高的功率转换效率(PCE),已经在太阳能电池行业占据了几十年的主导地位。然而,由于最大光电压受到带隙的限制,它们的PCE低于Shockley-Queisser极限(33.7%)。因此,新型光伏材料的开发备受关注。幸运的是
图像中的目标检测和自然语言描述依然是图像处理中热点研究课题。目前通用的目标检测方法对形变目标检测能力有所欠缺,小尺度目标检测精度稍差,图像目标检测结果摘要生成难度较大。此外,可视化图表本身也是一种人工合成图像,可视化图表摘要的自动生成也日益获得重视。因此,本文研究通过在Faster R-CNN中集成了Res Ne Xt网络、GN+WS算法、可变形卷积算法来提升自然图像目标检测精度,并应用图像的自然
随着社会的发展,科技的进步,数据挖掘、机器学习等新型技术已经融入人们的日常生活,使生活更加便利。但随着数据量的增大,数据类型更加复杂,使得这些技术受到一定的限制。因此,如何从数据中去除冗余信息,保证数据的精简,为后续研究人员在使用这些数据进行分析提供便利显得格外重要。粗糙集理论(Rough Set Theory,RST)作为一种数据挖掘技术,最大的特点在于无需任何先验信息就可以处理不精确、不完整、
磁制冷技术较传统的气体压缩制冷方式具有绿色环保、高效节能等优点而备受关注,具有广泛的应用前景。稀土-过渡族化合物具有丰富的磁结构与磁相变,一直是磁性材料领域的重要研究体系。相图是材料科学研究的基础,本论文选择稀土过渡族三元体系RE-Fe-Rh(RE=Nd,Ho)为研究对象,实验研究了RE-Fe-Rh在873 K的相平衡关系,构建了RE-Fe-Rh体系在该温度下的等温截面图。此外,还研究了部分RE-
由于三维图像测量能够快速和无接触的检测各种物体的表面性质和尺寸,该测量方法近年来已成为工业、医药、安全等领域广泛研究的课题,三维图像测量方法主要分为两大类,一类是如双目立体视觉这样的被动型测量方法,另一种是如模式光投影测量的主动型测量方法。本文主要对基于强度调制模式光的主动型测量方法进行了研究。解决投影条纹与观察条纹的对应关系是模式光投影测量技术的重要问题,但是由于被测物表面颜色的影响,投影条纹与