基于Kinect的中国手语识别研究

被引量 : 0次 | 上传用户:rebornfdgg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手语是聋哑人通过手和手臂,同时辅助头部动作、脸部表情和肢体姿态进行交流的语言。手语识别利用模式识别技术,通过分析手和手臂的动作特征,并将特征序列作为分类器的输入进行分类识别任务,最终将手语翻译为文字或者声音输出,实现听力障碍人群和正常人的正常交流。本文主要研究中国手语识别。本文利用Kinect摄像头进行手语识别,立足于交互方式上的改变,结合Kinect提供的深度数据和人体骨骼点数据,探讨了手语特征提取和融合;针对独立词手语和连续手语采用不同的分类器识别,极限学习机(Extreme Learning Machine, ELM)算法用于独立词识别效果较好,条件随机场(Conditional Random Fields, CRF)及其分支理论潜在动态条件随机场(Latent Dynamic Conditional Random Fields, LDCRF)常用于自然语言序列处理,本文尝试将其用于解决连续手语分割和识别的问题,主要工作如下:首先,分析了手语识别问题的研究背景和意义,综述了目前手语识别研究的国内外现状以及存在的主要问题,介绍了本文的主要内容和章节框架。第二,研究了基于Kinect的手语数据获取和预处理。手语数据获取的方式主要有摄像头,数据手套或者其他传感器。本文先后利用微软的Kinect V1和V2摄像头及其SDK,摆脱了数据手套和其他传感器的束缚,实现更加自然的人机交互。基于手语表达的运动特点,我们选取了手、大拇指、手腕和手肘人体骨骼点的空间运动信息作为手语的原始数据。第三,研究手语特征提取和分类识别。特征选取对手语识别的精度至关重要,也是模式识别中的重要组成部分。基于Kinect提供的深度图像和人体骨骼点数据,分别提取了右手单手和双手的手部3D运动轨迹和手形两个方面的特征表示,并将单一特征和融合特征作为后续分类器的输入。分类识别方面,比较了SVM和ELM两种算法,最终选择更高效的ELM方法作为分类器。为了验证本文特征选择和分类器的有效性,建立并发布了包含20类手语词的数据集。实验结果表明融合手形和运动轨迹特征表示明显改善识别率,特别是融合HOG手形特征和球坐标的特征对数据集中的8类中国手语词达到96.06%识别率。第四,研究连续中国手语识别算法。简单介绍目前国际上常用的连续手语识别算法及其优缺点。详细介绍CRF及其分支理论LDCRF的基本原理,分别从特征函数选择、参数估计、模型推断三个方面探讨模型的建立和参数优化算法。实验部分选用4个日常中国手语句子,初步实现连续手语的分割。
其他文献
目的分析天麻钩藤饮加减治疗肝阳上亢型原发性高血压病效果。方法选取2016年6月~2018年4月我院收治的肝阳上亢型原发性高血压病患者66例作为研究对象,将其随机分为对照组和实
金相分析是利用金相显微镜对在室温状态下金属材料的微观组织、结构特征进行观察,为科研、生产提供信息及数据[1]。当对此需要进行记录———金相显微摄影时,传统金相显微组
古文《尚书·大禹谟》所载"人心惟危,道心惟微,惟精惟一,允执厥中"的虞廷十六字对于宋明新儒学的道统论、心性论、工夫论皆甚为重要,意义不容忽视。本文认为朱子之前十六字的
目的观察自拟中药化瘀排石汤治疗泌尿系结石的临床疗效。方法将患者随机分为两组,治疗组给予自拟的化瘀排石汤,对照组给服排石冲剂,15 d为1疗程,连服4个疗程。结果治疗组疗效
2009年10月经国家发展改革委正式批复核准,建设上海迪士尼乐园项目,项目总投资近350亿人民币,该项目是继美国洛杉矶、奥兰多,法国巴黎,日本东京,中国香港之后迪士尼建立的第6
作为一门社会性学科,思想品德课教学绝不能将学生培养成“不闻窗外事,只读圣贤书”的学生,而应该引导学生去放眼更开阔的社会领域。以此,将具有客观性和时效性以及反映社会事
本文运用结构主义理论和功能主义研究方法,立足于现代汉语语言事实,主要从语法性质和语义功能两个角度出发,以现当代汉语中“连”类副词中的五个副词为研究对象,探讨它们在共
近两年来,微博与微信以其特有的形式迅速发展,成为广大人民的网上交流工具,随即出现了数量可观、范围广泛的政务微博与政务微信,并迅速成为政府信息公开、民众与政府交流的重
主观性标记是语言的主观性在语言中所残留的语迹,是人的认知对语言的影响的标记。主观量是语言的主观性在量范畴上的反映。学界对“主观量”的定义是:“含有主观评价意义的量