手语数据分析及生成技术

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:mir80
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手语是用手形动作辅之以表情姿势由符号构成的比较稳定的表达系统,是一种靠动作/视觉交际的语言。手语识别可以辅助聋人,通过计算机提供一种有效的、准确的机制将手语翻译成文本或语音,使得聋人和听力正常人之间的交流变得更方便、快捷。因此手语识别研究具有较高的研究价值。综合现在的研究现状,手语数据差异性矛盾以及训练样本缺乏已经成为制约非特定人手语识别研究发展的瓶颈问题。本文从数据出发,解决目前非特定手语识别中的“数据”问题,主要研究工作如下:1.提出了生成数据驱动的识别框架,分别给出了基于遗传思想和基于mean-shift的手语数据生成策略。基于遗传思想的生成策略利用手语数据的多数据流组成特性,首先使用动态时间规整算法进行样本序列对齐,然后采用交叉等遗传操作方式生成新的数据样本。基于mean-shift的数据生成策略则利用手语数据的空间分布结构特性,对手语数据进行无参估计进而得到概率密度分布的梯度方向,从而实现手语数据的内向生成和外向生成。实验表明,在未注册测试集的情况下,使用基于遗传思想和基于mean-shift的数据生成策略,系统的识别率均明显提高,其中采用遗传思想的数据生成策略系统识别率提高到67.3%;基于mean-shift内向生成在最优的参数设置情况下,识别率达到了71.5%,较原始训练集驱动结果提高了5.1%。2.从人体运动,语言学的角度出发,分析了手语数据的结构性和差异性特点,在此基础上定义体现手语数据共性和个性的方法。我们的方法通过提取、保留手语数据中的关键动作以保证手语数据的结构特性,即共性;定义并描述与手语数据个性信息密切相关的手语数据基本特征,包括运动轨迹、时长、手形等,为手语数据建立了有效的表现模型。3.在原有的中国手语合成系统的基础上,使用手语数据表现模型生成大量的有效、泛化数据驱动虚拟人进行手语显示,实现了泛个性化手语合成。将手语数据表现模型应用于手语合成不仅有效地证明了本文提出的手语数据表现模型的合理性,而且为手语泛个性化合成研究提供了有效的新途径。
其他文献
网格使人们可以无缝的集成广域资源来合作解决问题。在网格环境里如何有效的管理资源和调度计算就成为影响网格计算是否成功的最重要因素之一。而资源发现和资源选择又是网格
Linux系统是一款优秀的开放源码的操作系统,正是因为其开放性和可移植性使它在当前的嵌入式产品开发中有着非常重要地位。通用串行总线(USB)作为一种新型总线,日益广泛地应用
Web服务(Web Services)已经成为分布式网络计算的发展趋势。然而现有的Web服务技术只关注对服务输入输出数据类型以及访问细节的说明。由于缺乏语义描述,无法支持服务的自动
工厂各车间选址、医院布局、电脑键盘分布设计、任务分配调度等都可归结为二次分配问题。在理论上,二次分配问题属于组合优化问题,存在“组合爆炸”现象。归因于NP-hard属性,很
手语识别研究的目的是增进聋人与听力健康人之间无障碍的交流,提高计算机对人体语言的理解能力。非特定人手语识别是推动手语识别系统实用化所必须解决的问题。目前,非特定人
语音识别是计算机技术的一个重要发展方向,是指机器通过学习来实现从语音信号到文字符号的理解过程,也就是让计算机听懂人的话,并做出正确的反应。语音识别作为一门交叉学科,与声
传统的基于内容的图像检索系统返回给用户的是按照与查询图像相似性大小排序的目标图像序列,而目标图像之间的相似性在系统中被忽略掉,基于聚类的图像检索系统返回给用户的是
随着Web资源的不断丰富和增加,Web站点结构变得越来越复杂,传统的Web站点缺乏智能性和主动性,因此,面对复杂而庞大的万维网,人们不容易找到自己感兴趣的信息,同时Web站点和Web服务
无线局域网技术使得网络的接入方式不再受物理线路的局限,嵌入式技术使得通信设备向着微型化、低功耗、高性能的方向发展。本文研究的地铁无线通信系统正是无线局域网与嵌入
Web页面检索和推荐是搜索引擎中网络信息处理的重要组成部分,它可以自动地从网络文档中发现和抽取用户感兴趣的信息,对于构建主题式的搜索引擎具有重要作用。本文对主题式搜