面向语音情感识别的深度学习模型研究

来源 :青海师范大学 | 被引量 : 1次 | 上传用户:qimao1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人类活动中,情感智能尤为重要,确定情感类别是情感智能的核心。通常,相同语义内容可能表达不同情感,不同说话者表达情感的方式也有所差异,要使计算机能够完全理解说话者意图,需要使计算机具有情感智能。语音情感识别旨在利用计算机从语音中提取最能表征情感的特征,并根据这些特征判定说话者的情感类别,从而更好地实现人机交互。语音情感识别研究主要面临以下问题:(1)缺乏统一的数据库构建标准;(2)未找到最能表征语音情感的特征;(3)声学模型的泛化性和鲁棒性较差。针对上述问题及各种神经网络的优点,本研究的贡献如下:(1)将循环神经网络、卷积神经网络和深度残差网络相结合构建新的语音情感识别声学模型,利用循环神经网络处理时序信息,卷积神经网络捕捉空间信息,深度残差网络处理网络层数加深时出现的梯度爆炸或梯度消失问题;(2)将Attention机制和Mask操作引入神经网络声学建模中,利用Attention机制关注语音中情感突出的部分,利用Mask操作提取语音中感兴趣的区域;(3)提出了4种新的深度学习模型。即基于注意机制的改进的双向长短期记忆(Attention mechanism based advanced long short-term memory,AA-LSTM)网络、基于注意机制的卷积双向长短期记忆(Attention mechanism based Convolution bi-directional long short-term memory,CBAM)网络、基于注意机制的跳跃卷积双向长短期记忆网络(CBAM with skip connections,SCBAM)和具有掩蔽操作的基于注意机制的跳跃卷积双向长短期记忆(SCBAM with masking operations,SCBAMM)网络;(4)将语音转换为频谱,采用所提出的4种新的深度学习模型提取语音的时序信息、空间信息及情感相关的34维深度学习特征和2维的谐波噪声比、基频等手工特征,并将谱特征和语音声学特征相结合作为声学模型的输入;(5)在EMO-DB数据库上验证本研究提出的4种新的深度学习模型的性能。通过实验证明,本研究所提出的4种深度学习模型——AA-LSTM模型、CBAM模型、SCBAM模型和SCBAMM模型在EMO-DB德语情感语音数据库上分别取得了70.09%、56.07%、64.49%和72.09%的识别性能。可以看出,SCBAMM模型实现了最优分类,将SCBAMM模型与其他研究者的分类模型相比,SCBAMM模型也取得了最优的分类性能。这是因为SCBAMM模型不仅有效提取了时频两域最能表征情感的特征,同时也结合了循环神经网络、卷积神经网络和深度残差网络的优势,具有强大的建模能力。
其他文献
利用汽车、船舶、飞行器等运行工具的旅行,常常伴有刺激前庭器官引起的恶心、呕吐、眩晕、心动过速等自主神经系统的反应。据报道,前庭神经核神经元的活动影响血压和心律, 急
会议
习近平总书记强调,要坚持党对国有企业的领导不动摇,发挥企业党组织的领导核心和政治核心作用,保证党和国家方针政策、重大部署在国有企业贯彻执行。然而在实践中,党建工作与
我国近年来的离婚率呈现出直线上升的趋势,离婚妇女需要克服的不单单是自己的经济问题,还有对子女的抚育以及家庭重担的承担问题。我国的《婚姻法》中存在着社会性别视角缺失的问题,让我们逐渐认识到离异妇女的权益保护问题存在着诸多不足。我们必须要认识到妇女的权益可以得到充分的保障也是社会进步和性别权利平等的一种要求,而我国的婚姻法在某些方面还是不能有效地保障离婚妇女的权益,这会造成一系列问题的出现,长此以往,
由于微电子集成技术发展,电子及电气元器件产品尺寸急剧缩小,各类微电子器件的封装及散热、电气绝缘材料的导热以及航空航天等特殊场合的热管理,常规材料的散热问题已成为其
随着教学模式改革的推进,智慧课堂逐渐出现在了小学教育工作者们的视野之中,随着这一课堂教学模式的应用,智慧课堂在教育中的优势也逐渐地凸显了出来,越来越多的小学教师将智
幼儿抗挫折能力,是指幼儿忍受和排解挫折,摆脱困难和挫折情境的能力。已有研究表明3-6岁是幼儿抗挫折能力成长的关键期,其中中班家长对幼儿抗挫折能力指导的需求较强,因此本研究尝试以绘本为载体,来探究挫折主题绘本活动对于中班幼儿抗挫折能力的影响和作用,为幼儿教育工作者和家长提供参考依据。本研究选取广西壮族自治区某幼儿园的2个中班幼儿为研究对象,分别作为实验班和对照班,在实验前对两个班级进行前测,之后在实
目的:中药中所含有的化学成分复杂多样,各成分混杂,使用传统方法分离纯化较为困难,也难以进行有效物质基础研究,导致现代中药研究发展缓慢。针对这些问题,我们需要建立更简单易行、方便快捷的纯化分离方法,进行中药复杂化合物成分研究。方法:本文以中药延胡索和荷叶为例,利用延胡索中两类生物碱成分在不同p H值条件下自身电荷性质不同,通过调节流动相的p H值,建立了延胡索不同生物碱类组分分离方法;利用荷叶中生物
雄县地热资源丰富,是华北地区地热资源条件最好的地热田之一。开发历史悠久,并取得了良好的社会、经济和环境效应。该区的主要热储是蓟县系雾迷山组岩溶热储。根据水化学分析
创新是中国快速持续发展的金钥匙,也是我中华民族发展的灵魂。随着知识经济这样一个新时代的到来,创新精神俨然成为解放生产力和大力发展经济的根本基础之一。而放眼全球,几乎大多数国家民族都在积极推进教育改革来培养创新人才、发展创新技术,而教育改革的工作,核心就是提高大众的文化素质教育水平和培养能力强、素养优的创新人才以适应并迎接已经到来的新时代。在接受高等教育之前,中学教育是学生培养其基础能力的一个重要阶
音乐在人类历史中起着重要的作用,在现今的数字时代更是如此。现在音乐的数量以指数的形式增长,与此同时,对音乐进行组织、分类、检索的需求也在不断增加。基于音乐情感的分