融合人脸表情的手语到汉藏双语情感语音转换的研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户：sunsand

【摘要】

：

目前模式识别技术在各个领域中得到应用。手语识别技术、人脸表情识别技术以及情感语音合成技术都得到了很好的发展。但是目前大多是对手语识别、人脸表情识别以及情感语音合

【作者】

：

宋南

【出处】

：

西北师范大学

【发表日期】

：

2004年期

【关键词】

：

手语识别人脸表情识别深度神经网络汉藏双语情感语音合成手语到语音转换

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目前模式识别技术在各个领域中得到应用。手语识别技术、人脸表情识别技术以及情感语音合成技术都得到了很好的发展。但是目前大多是对手语识别、人脸表情识别以及情感语音合成方法三个方面的研究方向分别进行研究。尽管有关手语到语音的转换研究已经得到了实现,但是转换后的语音不能表达情感信息,当聋哑者与正常人进行交流的时候,他们往往会因为缺乏情感表达而理解歧义。本文针对言语障碍者的日常交流障碍问题,提出了一种融合人脸表情的手语到情感语音转换的方法。首先使用深度置信网络(Deep Belief Network,DBN)方法与深度神经网络(Deep Neural Network,DNN)方法分别得到两种手语库中预定义的手语特征,并通过DNN方法获得人脸表情特征。其次采用支持向量机(Support Vector Machine,SVM)分别进行分类,并分别获得手语文本及相应的情感标签。同时,利用普通话情感训练语料,分别采用隐Markov模型(Hidden Markov Model,HMM)方法和DNN方法,搭建了一个情感语音合成平台。最后,利用识别获得的手语文本和情感标签,将手语及人脸表情转换为普通话或藏语的情感语音。论文的主要工作与创新如下:1.识别了两种手语库并获得了手语的上下文相关标注。首先,针对30种中国字母手语,利用DBN模型提取手语特征,并结合SVM进行识别分类;针对36种美国手语,利用DNN模型进行特征提取,并采用SVM识别分类。然后,将通过手语识别得到的手语类别利用设计好的手语字典进行查找从而得到了手语文本。最终通过文本分析程序将得到的手语文本进行分析进而得到了手语文本的声韵母信息以及它的上下文信息。通过上下文相关标注形式来表示声韵母的上下文信息,其中包含普通话或者藏语声韵母信息、音节信息、词信息、韵律词信息、短语信息以及语句信息共6层信息。2.识别了两种人脸表情库并获得了情感标签。首先,通过利用DNN模型对扩充的Cohn-Kanade数据库(the extended Cohn-Kanade database,CK+)以及日本女性面部表情(Japanese female facial expression,JAFFE)数据库两种人脸表情数据库进行表情特征提取,并利用SVM识别分类。然后,通过利用人脸表情识别部分得到的情感标签,去选择对应的情感语音声学模型,进而能够通过语音合成平台合成出对应情感的语音。3.实现了手语到情感语音合成。首先,采用基于HMM的方法去训练情感声学模型,同时利用说话人自适应变换的方法得到目标情感声学模型,实现了汉藏双语情感语音合成。其次,利用基于DNN的说话人自适应方法,获得目标情感语音模型,实现了情感语音合成。最后利用DNN进行声学模型训练,再利用说话人自适应(DNN)方法,实现了汉藏双语情感语音合成。

其他文献

重载发动机缸盖再制造成型中气孔裂纹的仿真研究

再制造技术是将废旧产品中不能使用的零部件通过先进的表面技术,在损伤表面制备熔覆层,使其质量达到或超过原有性能。目前应用于大马力、大扭矩重载车辆中的重载发动机缸盖,

学位

等离子熔覆灰铸铁气孔裂纹模拟仿真

含动态侧隙的风电机组齿轮传动系统暂态特性及动力学分析

随风力发电技术的完备,风力发电已经成为一种易开发、可再生、绿色环保的发电方式。齿轮传动系统作为风力发电机系统中重要部件。因齿轮传动系统工况复杂、高空布置、故障率

学位

齿轮动态侧隙齿根裂纹风力机暂态特性

分级循环荷载下丁字形裂隙试样的力学特性及其损伤规律实验研究

实际工程中岩体的裂隙往往是交叉不等长的,且其对于整个岩体的力学特性以及损伤规律有着重要的影响。而在实际工程中,岩体在承受静力荷载的同时,也承受着不同特性循环荷载的

学位

丁字形交叉裂隙分级循环荷载力学特性损伤

X证券公司无锡营业部经纪业务业绩提升策略研究

近年来国家监管部门对证券公司发展的政策不断调整,同时允许民营资本和外资注入,使得竞争进入白热化状态。截止到2016年底,正规经营的证券公司达到129家,佣金费率的持续下降

学位

经纪业务服务营销服务运营商专业培训业绩提升

基于自动限制损失的图像语义理解

图像语义理解是计算机视觉,自然语言处理和机器学习领域中的一个基础问题。目的是将图片转换成一句能描述图片中对象及对象之间关系的句子。将复杂的图像特征转化为简单的语言描述在图像分类、图像检索、图像动作识别等领域中有较广泛的应用前景。近来,许多方法采用编码-解码框架,在训练阶段,使用当前时刻状态和前一时刻的目标单词预测当前的目标单词。在预测阶段,由于上一时刻的目标单词并不确定,而使用上一时刻模型输出的单

学位

图像语义理解注意力机制循环神经网络自动限制损失

ZmmiR169q在玉米应答盐胁迫中的作用及机制研究

玉米是全球范围内重要的粮食、饲料和工业原料作物,土壤盐碱化极大地影响了玉米的生长和最终产量,miRNAs是植物生长发育和逆境应答过程的关键调控因子,但miRNAs参与玉米高盐

学位

玉米盐应答miR169NF-YA活性氧

移动网络中基于口令的三方认证多密钥交换协议研究

随着移动通讯技术的迅速发展和社会信息化程度的逐渐提高,无线网络技术在信息处理及信息交换等场景中得到广泛应用。移动网络及智能移动终端设备已成为人们生活和工作中不可

学位

移动网络安全密钥交换协议椭圆曲线密码体制随机预言机模型可证明安全

考虑蒙皮效应钢结构冷却塔静力稳定性及风致响应研究

冷却塔在火力发电中有着非常重要的作用,随着社会的进步和工业的发展,冷却塔的体型越来越大,结构形式越来越复杂,混凝土材料的缺陷表现的越来越突出,而钢结构冷却塔具有自重

学位

钢结构冷却塔风洞试验风振系数静力稳定性参数分析

杯[4]吡咯改性磁性吸附材料的制备及应用研究

随着社会的不断发展,工业也得到迅速的发展,伴随着工业的发展而带来的一系列环境问题越来越受到了人们的关注。其中,化妆品制造、皮革处理、金属部件镀铬等工业可能带来的Cr(

学位

杯[4]吡咯磁性吸附材料聚苯胺修饰的Fe3O4吸附Cr(Ⅵ)离子

基于近景摄影测量的单木结构参数提取研究

单木结构参数反映了森林生长趋势以及健康状况,对森林的经营管理有着重要意义。传统的单木结构参数测量方法费时费力,因此本研究引入近景摄影测量技术,目的是更加方便快捷的

学位

近景摄影测量单木结构参数相机校检SFM算法地面三维激光扫描

融合人脸表情的手语到汉藏双语情感语音转换的研究

其他学术论文