基于计算机视觉的中国手语识别技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:cs_
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手语是聋哑人与外界交流的重要媒介。研究以普通话为基础的中国标准手语识别,能够为聋哑人与正常人之间沟通提供便利,同时,还能促进人机交互领域的发展。近年来,随着计算机技术与深度学习的迅速发展,利用计算机视觉对手语或手势进行分类识别逐渐成为国内外科研人员的研究热点。本文的主要研究内容是基于计算机视觉的中国手指语识别,包括建立手指语图像库,对手指语图像进行初步预处理、特征提取和分类识别等。具体如下:首先,采集手指语图像建立手指语图像库,并对图像库内的手指语图像进行预处理。预处理操作包括肤色聚类、图像平滑、形态学变换以及图像分割,最后将图像统一大小为300×300。预处理操作是后续手指语图像特征提取与识别的基础。然后,针对SVM构建模型过程中面临的最优参数选择的问题,引入灰狼优化算法对SVM参数进行优化,以实现手指语的识别。分析常见的特征提取方法和分类器,选择HOG特征和SVM分类器。利用灰狼优化算法优化SVM参数,找到最优参数的时间更短,识别的速度更快。在手指语识别中,提取HOG特征,利用灰狼优化算法优化SVM参数,送入到径向基核函数(RBF)的SVM分类器,实现手指语识别。实验表明此算法可以用于手指语识别,具有一定的有效性和可行性。最后,针对传统人工手动提取特征主观性较强,以及其他深度学习对数据集要求较高等问题,采用深度迁移学习算法实现手指语识别。对比了Inception V3和Res Net50模型应用于只替换分类器的参数迁移和冻结不同网络层的微调模型对手指语识别的效果。实验证明Res Net50模型对手指语的识别效果更好。利用Res Net50模型冻结网络50层,微调其他参数后对手指语图像进行预测。实验表明本文采用的深度迁移学习算法可以用于手指语的识别,与传统人工特征提取特征和其他深度学习算法相比,具有一定的优越性。
其他文献
能源的不断消耗与环境污染等问题使得传统汽车的驱动能源不得不转型升级,电力驱动成为解决车辆能源问题的关键所在,因此电动车辆应运而生。与传统发动机驱动车辆和集中式电驱动车辆相比,分布式驱动具有驱动链短、效率高、转矩独立可控、响应速度快、车内空间增大等优点被市场所青睐,许多研究学者纷纷对此展开研究。分布式驱动电动车辆在不同工况下如何进行转矩分配,才能使得车辆的安全性与经济性得到最优解,已经成为研究热点问
随着云计算技术的长足发展和广泛应用,出现了许多云服务平台,各大云服务平台的用户数量也成爆炸性增长。但随之而来的一系列有关云计算的安全事件层出不穷,例如云服务平台遭宕机和用户信息数据被窃取等。相比于传统的计算机系统,云服务平台受到入侵攻击的影响更大,范围更广。因此,如何更好地保障云服务平台的安全,已成为当前网络安全领域备受关注的焦点。基于此,本文主要做了以下研究工作:(1)本文从入侵检测方向入手,通
金刚石具有宽禁带、高热导率、高载流子迁移率和高击穿电压等优异性质,被认为是一种理想的半导体材料。氮是金刚石中最常见的杂质原子,在天然和人造金刚石中都普遍存在,因此研究氮掺杂金刚石具有重要的研究意义。然而氮掺杂金刚石存在电阻率高、载流子浓度和迁移率低等问题,这些严重制约了它在半导体方面的应用。对于氮掺杂金刚石来说,经常采用先辐照后退火的手段以提高载流子浓度与迁移率。而电子辐照可以在氮掺杂金刚石中引入
随着近年来,对于中小学心理健康教育的关注度不断提高,各方要求发展心理健康教育工作的呼声不断高涨,我国的心理健康教育工作逐渐迈入了一个崭新的历程。2012年12月《中小学
2012年,Gutman和Wagner提出了图的匹配能量的概念.令G是一个具有n个顶点的简单连通图.图G的匹配能量定义为(?),其中m(G,k)是图G的k-匹配的数目.本学位论文主要研究了完全多部图和若干稀疏图类的匹配能量,并刻画了这些图类中达到最小匹配能量的极值图类.在第一章,我们介绍了所研究问题的背景知识和学术现状,并对本文的主要结果进行了概述.在第二章,我们研究了完全m-部图的匹配能量,并刻
随着我国社会经济的发展以及国家对枣类培育的重视,使枣类农作物的种植面积不断扩大,然而现阶段枣采摘仍是以人工采摘为主,存在劳动力需求量大,效率低且成本高昂等问题,虽然也出现了机械采摘的方式,但伴随而来的是枣采摘损失率较高,已无法满足大规模农业生产的需要。智能制造等新技术的发展,为解决这些问题提供了有效途径。本论文针对当前枣果实采摘面临的人工采摘效率低,机械采摘损失率较大等问题,基于深度学习框架,设计
炮控箱控制着炮控系统大部分部件的工作,火控系统对炮控系统的控制也是通过炮控箱来完成的。它通过电缆与其他部件相连,用以完成对炮控系统的启动、调整、控制、工况转换和显
碳化硼(B4C)陶瓷是目前最具潜能的特种陶瓷之一,凭借着密度低、硬度高、膨胀系数低、化学惰性高、介电常数低等优良特性,被广泛用于军工、核工等领域。但由于其难烧结和陶瓷本
研究目的:研究结直肠息肉的临床特点、中医证素不同分布规律及结直肠息肉的中医证候,归纳总结结直肠息肉的中医证素,为后续研究打下基础。研究方法:1、选取2018年8月至2019年3月被上海中医药大学附属曙光医院内镜中心检查确诊且符合纳入标准和排除标准的153名息肉患者填写问卷。2、根据患者的临床症状,结合四诊资料信息,参照《证素辨证学》,提取病位证素、病性证素,再将提取的各个证素相加。依据证素诊断标准
数字化、信息化、网络化是当今时代发展的大趋势,地质体可视化逐渐成为地质领域的研究热点。“数字矿山”越来越受到矿产采集行业的关注,数字化地质数据也越来越受到城市规划者的重视。传统的三维地质数据可视化软件大多停留在C/S(客户机/服务器)模式,一般需要下载插件,费时费力且兼容性差,难以满足地质信息便捷快速传递的要求。随着WebGL技术的成熟与完善,基于B/S(浏览器/服务器)模式的Web端三维地质可视