采用谱-韵律双变换的语音情感转换

来源 :苏州大学 | 被引量 : 0次 | 上传用户:pdiudiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
除了语义信息,人类语音还传达着情感信息,同一句话传达的信息可能会因为情感的不同而不同,语音情感转换即是在保持语义不变的基础上,将一种情感转换成另一种情感,具有深远的应用意义。本文基于EMO-DB和DES两大公开情感语音库对情感语音特征进行分析,并针对谱特征和韵律特征是情感特征的两大关键因素,提出了谱-韵律双变换的语音情感转换,弥补了传统语音情感转换只着重于转换其中一种特征的不足。在谱特征转换阶段,通过分析不同谱特征参数和谱特征转换模型优缺点,本文选用GMM (Gaussian Mixture Model)作为模型,LSF (Line Spectrum Frequency)作为谱特征参数进行转换,基于STRAIGHT平台合成情感语音。在韵律特征转换部分,不同于以句子为单元分析韵律的传统方法,本文针对语音信号韵律特征的时变性,提出了PTR (Prosody Transformation Rule)算法对多种韵律特征(包括时长、音强和基频)进行局部分析转换以提高转换效果。同时针对重音能加强愤怒语音的情感,而基频对重音的影响最大的情感分析结果,本文在PTR基础上进行改进,提出PTR结合单高斯的算法来调整愤怒语音的局部基频从而达到愤怒语音带重音转换的效果。本文对转换后的情感语音做了基于ABX和MOS的主观评测,评分结果表明本文提出的方法达到了很好的语音情感转换效果,带重音转换的愤怒语音情感相对得到提高,同时本文通过采用支持向量机对转换后的语音自动分类来进行客观评测,评测结果达到了78.25%的正确率。
其他文献
本文内容为汽轮机故障诊断系统的设计与实现。采用B/S模式进行开发,涉及Web服务器、数据库和通信协议等模块的开发。系统地介绍了汽轮机轴系振动的主要故障及其特征信息,并对之
无线传感器网络是当今备受国际关注的、涉及多学科知识的新兴前沿热点研究领域,是在互联网普及之后将对人类的日常生活方式产生巨大影响的IT技术。传感器节点定位作为无线传感
随着社会经济的发展,人们对工作生活环境的舒适度和建筑设备能效提出了更高的要求。空调系统是智能建筑中的重要设备,在日常生活中已经得到了广泛应用,其优化控制对提升建筑环境
径向基函数神经网络(Radial Basis Function,RBF)是一种高效的前馈式神经网络,它具有的最佳逼近性能和全局最优特性,并且结构简单,训练速度快。RBF神经网络也可以应用于模式识别、
随着社会的发展,人们聚集的公共场所也越来越多如,地铁,车站,码头等,这些场所都有一个公共的特点,人员集中,流动量大。一旦发生紧急事件,如火灾、爆炸等,很可能造成重大人员伤亡。如何
随着科学技术的发展,在硬件领域,基于精简指令集的arm系列芯片的推出,为嵌入式产品的发展提供了硬件支持。在软件领域,LINUX系统凭借着其代码的开源、运行的健壮及强大的网络
钢铁工业是国民经济的支柱产业,在国民经济的发展中发挥着重要的作用。炼钢-连铸生产是钢铁厂生产流程中的关键工序,合理的进行订单管理、制定可行的生产计划,对于加快工艺节奏
车轮是列车上的重要走行部件,车轮不圆会影响到列车的平稳运行和乘客的乘车舒适,更严重的会危机行车安全。近些年来,随着列车运行速度的不断提高,对于列车车轮圆度的要求也随
现代信息科技的飞速发展,使得人们对信息的需求量越来越大,需要处理的数据也越来越多。在传统的信号处理框架中,只有采样频率达到信号带宽的两倍以上才能保证重建信号不失真。但
作业车间调度(Job Shop Scheduling)是在车间层资源约束条件下实现生产任务优化的过程。现有作业车间调度研究多基于理想的作业车间调度模型和严格的假设条件,忽略了加工时间