【摘 要】
:
人机交互是现代计算机技术不断智能化和自动化发展的一个趋势。人机交互是人体通过自己的手势、行为、语音和表情等与计算机进行交流,为人类操控计算机提供了多样且智能的方式。随着现代计算机视觉技术的兴起,基于视觉的人机交互方式成为发展的主流。其中,静态手势识别和动态人体行为识别等技术是新兴的视觉人机交互的重要方式,可以在设备解锁、机器人运动操控等方面提供出色的表现。而且基于卷积神经网络的图像处理技术表现优异
论文部分内容阅读
人机交互是现代计算机技术不断智能化和自动化发展的一个趋势。人机交互是人体通过自己的手势、行为、语音和表情等与计算机进行交流,为人类操控计算机提供了多样且智能的方式。随着现代计算机视觉技术的兴起,基于视觉的人机交互方式成为发展的主流。其中,静态手势识别和动态人体行为识别等技术是新兴的视觉人机交互的重要方式,可以在设备解锁、机器人运动操控等方面提供出色的表现。而且基于卷积神经网络的图像处理技术表现优异,在硬件设备的保证下,能够充分提取图像特征,可以为视觉人机交互方式提供更好的理论支持。因此,本文在视觉人机交互方式的研究中引入卷积神经网络,使用静态标准手势数据集和动态标准人体行为数据集,分别采用FSSD网络和长期双向循环卷积网络研究复杂背景下的静态手势识别和动态人体行为识别,提高了识别准确率,丰富了智能人机交互的方式。本文的主要研究内容如下:(1)手势数据集增强。详细介绍和分析了手势数据集,针对数据集中远景样本不足的问题,本文设计背景叠加法对数据集中的图像进行处理,扩充了手势识别数据集中的远景样本,平衡了手势类别;同时针对数据集中每类手势样本不足的问题,采用图像空间几何变换的方法扩充手势数据集。(2)静态手势识别。针对复杂背景下静态手势准确率低和识别速度慢的问题,本文设计了一种基于FSSD的静态手势识别算法,算法分为特征提取网络和预测网络。首先,在特征提取网络中设计了反残差深度可分离模块提取静态手势特征,在尽可能保留特征信息的条件下极大地提高了算法的运算速度。其次,在特征提取网络中设计了h-swish激活函数用于深度网络中,提高了算法的准确率。最后,在手势测试集和计算机实时拍摄的动态图像帧中对算法模型进行测试,获得算法的测试准确率和识别速度。实验结果表明,本文设计的基于FSSD的静态手势识别算法提高了复杂背景下手势识别的准确率,满足了手势识别的实时性,可以用于中小型计算机设备中作为人机交互的方式之一。(3)人体行为图像处理。针对复杂背景和其他运动物体干扰的问题,本文采用注意力机制的思想,通过设置图像中前景和背景两部分的权重,重新分配图像的计算资源,对动态人体行为数据集进行了处理。首先,使用FSSD网络训练获得人体检测算法模型。其次,使用算法模型获得图像帧中人体的信息,确定人体的位置和尺寸。最后,将复杂背景和其他运动物体干扰部分的权重设为零,即对其所在位置的像素值进行归零处理。实验结果表明,本文设计的目标定位和资源分配的方法能使人体行为数据集聚焦在人体运动行为上,去除了复杂背景和其他运动因素的干扰。(4)动态人体行为识别。针对存在复杂背景和其他运动物体干扰下的人体行为识别准确率低的问题,本文设计了一种基于长期双向循环卷积网络的人体行为识别算法,由卷积神经网络和双向长短期记忆网络组成。首先,卷积神经网络能够提取每一帧的深度特征信息,获得人体行为的表观特征。其次,双向长短期记忆网络能够提取图像帧与帧之间存在的上下文关系,获得人体行为的运动特征。且双向长短期记忆网络能够将当前帧与上一帧和下一帧同时建立联系,使当前帧的输出结果不仅与上一帧图像有关,也与下一帧图像有关。最后,在人体行为测试集上对算法模型进行测试,获得了算法的准确率和参数量。实验结果表明,本文设计的基于长期双向循环卷积网络的动态人体行为识别算法提高了人体行为识别的准确率,且算法参数量相对较小,可以作为更自然和智能的人机交互方式。
其他文献
随着国家十四五计划的稳步推进,交通出行被人们广泛关注,其中对公路交通安全提出了更高的要求,截止目前为止,全国公路网基本全部建成,公路建设进入养护期,由于缺乏有效的监测手段,每年养护道路的成本一直居高不下,而且也延缓了智能交通建设的步伐,因此研制一套可实时监测的公路路基健康检测系统对于保障公路出行安全意义重大。本文通过分析公路路基损坏常见的故障类型,设计了一套公路路基智能检测控制系统,本系统可实现公
随着现代物联网和人工智能产业的迅速蓬勃发展,电容式柔性压力传感器不仅在可穿戴式交互电子设备中的应用随处可见,而且在电子皮肤、柔性屏幕、医疗检测、智能纺织、航空航天等诸多应用中有着广泛前景。作为传感器最重要的性能指标,灵敏度一直都是国内外的研究热点所在。在本文的工作中,选用PDMS作为复合介电层的基础材料,通过介电层掺杂和造孔来提升传感器的灵敏度,最终取得了灵敏度高、线性响应范围宽、迟滞误差小、循环
随着人口老龄化加剧,各种重大疾病频发,越来越多的人需要使用组织器官移植的手段来恢复健康、延续生命。然而不幸的是,目前器官的捐赠数量远远达不到病人的需求量,而且异体器官移植的患者也会因为免疫排斥需长期服用药物,3D生物打印正是为解决这个问题产生的。本课题紧跟这一热点,本研究围绕3D生物打印机的构建,设计了一种可三维移动平台系统和温度控制系统。以满足3D生物打印机的功能需求,并通过打印支架,测试温度控
随着柔性应变传感器的高速发展,越来越多的人开始对柔性传感器特别是高弹性的应变传感器提出了更多的要求。对于柔性应变传感器,提高传感器的检测范围通常有改变敏感单元材料、提高基底的可拉伸性能以及改变传感器外形几何结构等方法。本文旨在扩大传感器的可拉伸范围,并在大范围拉伸条件下提高传感器的应变系数。鉴于热塑性弹性体styrene ethylene butylene styrene(SEBS)是一种弹性大以
煤炭资源是我国重要的能源矿产资源之一,煤矿的安全生产支撑着国民经济的持续发展。当煤矿井下发生瓦斯爆炸、顶板冒落等重大灾害时会造成井下断电故障,造成通信网络链路中断,致使救援中心无法探知煤矿井下人员信息,增大灾后应急救援难度。本文结合光纤传感技术可实现信号无源探测的特点,以声波探测为基础,研究设计了一种基于煤矿井下既有光缆的应急通信光纤传感信号解调系统,可检测矿井灾后供电中断下被困人员的声音信息。本
近年来工业及社会经济的飞速发展让人们享受了生活质量提高的同时,也带来了严重的空气污染问题,尤其是毒害气体的排放对人们的身心健康及财产安全产生了极大的威胁。因此,越来越多的研究人员致力于开发高效检测有毒有害气体的检测装置,气体传感器由于易制备、成本低、体积小等优点在气体检测领域得到了广泛应用。作为决定气体传感器性能的核心部分,敏感材料的选择也成为了主要的研究对象。目前,基于金属氧化物半导体材料(MO
随着社会上科学技术的不断进步,人们的生产生活方式逐渐向着智能化和自动化的方向发展。在气象和航空领域中,随着深度学习技术的不断引入,云团识别、云团分类、云团分割、飞行器自动化航行以及航行线路规划等是领域内专业性较强的问题,如何利用深度学习自动化完成一直是相关研究人员研究的热点。卫星云图中包含着丰富的信息资料,其中所包含的各类云团信息更是在气象和航空领域中天气预测和航线规划的不可或缺的基本资料。针对庞
随着柔性电子器件的发展,柔性传感器的应用范围越来越广泛,其内容包括力传感器、温度传感器、湿度传感器等。近年来,柔性磁场传感器的研究也越来越进入人们的视野。目前大部分磁传感器都是刚性传感器,未来设备要求磁传感器具有出色的柔韧性和可拉伸性,以便适应复杂的检测环境和机械变形,因此对于柔性磁场传感器的研究迫在眉睫。许多研究人员基于压电、摩擦电、应力等不同机制实现了柔性磁场传感器的制备,并对其响应原理进行了
随着经济的快速发展和科技的不断进步,移动机器人在生产生活中扮演着越来越重要的角色,而移动机器人的位姿估计是实现机器人应用必须要解决的关键问题。本文着重研究非高斯噪声下的移动机器人的位姿估计算法,以提高移动机器人位姿估计精度。在同时定位与地图构建(Simultaneous Localization And Mapping,SLAM)框架下,研究内容围绕影响机器人位姿估计精度的后端优化算法和前端点集配
“十四五”规划纲要指出:加快数字化发展,打造数字经济新优势,建设数字中国。数字化必将深刻引领社会变革,数字化落地是当代科研工作者将理论与现实结合的重大使命。全面数字化的实现需要强大的算力中枢和优良的算法系统。图像检索领域的研究是数字化社会的重要内容。如何快速且准确的在海量图像中检索出所需图像是一项具有挑战性的任务,本文在传统图像检索的基础上加以改进,对其经典算法进行深入改良,结合深度学习技术在提取