【摘 要】
:
年龄语音转换是指在保持语义信息不变的情况下,调整说话者语音特征参数中的年龄信息,将源年龄段说话者的语音转换为目标年龄段的语音。年龄语音转换是针对非特定人的,即转换
论文部分内容阅读
年龄语音转换是指在保持语义信息不变的情况下,调整说话者语音特征参数中的年龄信息,将源年龄段说话者的语音转换为目标年龄段的语音。年龄语音转换是针对非特定人的,即转换后的模型可以适用于同一年龄段的所有说话者,它与一般语音转换有一定的区别。为了更好地研究与年龄信息相关的语音特征参数,针对儿童、青年、中年和老年四个年龄段建立了较全面的年龄语料库。在此基础上提出了一种新的基于短时频谱UBM群联合韵律参数的方法用于非特定人的年龄语音转换。为了减少相同年龄段不同说话者语音的差异性,本文对同一年龄段不同说话者的谱参数各自建立GMM模型,通过自适应聚类得到UBM群。UBM群中每一个UBM模型通过与目标年龄段语音的谱参数进行联合训练得到一组谱转换函数。在转换阶段计算测试语音在UBM群每个UBM模型中的似然度,按最大似然度原则得到最佳谱转换函数。在谱转换后,进行共振峰微调以减小重要频谱信息的丢失和模糊。另一方面,选择了对年龄语音影响较大的韵律参数进行韵律转换。最后用STRAIGHT工具合成转换后的年龄语音。主观和客观评价的实验结果显示,本文提出的方法,使得转换语音在保证语音质量的同时目标倾向性更好。此年龄语音系统实现了青年向其他三个年龄段的语音转换,具有普适性,无需重复训练,提高了系统的效率和灵活性。
其他文献
随着IPv4地址的日益耗竭,IPv6逐渐取代IPv4成为互联网发展的必然。由于目前大部分设备和应用都基于IPv4,所以IPv4与IPv6将长期共存并最终向IPv6过渡,而双栈技术是实现IPv4与I
在第四代通信系统的标准化工作日益接近尾声的情况下,3GPP的LTE-Advanced和IEEE的802.16m两个标准已经成为了国际电信联盟的4G候选标准,其中尤其以LTE更为业界大多数厂家和研
在新型的无线电通信系统不断涌现的今天,短波通信一直是世界各国远距离通信的主要方式之一。在短波通信系统的研制后期,短波信道的时变性和无法预测性会给测试工作带来困难,
GPS在军事以及人们生活的各个领域都有广泛的应用,它具有高精度、全天候、全球覆盖等优点。它是造福人类社会的一项伟大工程,具有不可替代的作用和划时代的意义。
首先论
随着光通信系统对于传输距离、信道容量和传输速度的要求越来越高,单靠光纤自身的低损耗特性已很难满足系统对低误码率的要求,使得通信系统中的有效性和可靠性这对矛盾再次凸
深度信念网络(Deep Belief Network,DBN)是近年来新兴的一种机器学习模型。其动机在于模拟人的思维方式来学习、分析数据,比如文本、声音和图像。DBN结合了无监督预训练和有
由于电子瓶颈的影响,交换网络的容量和带宽受到的很大的限制,因此具有大容量和高交换速度的光分组交换(OPS)成为未来交换网的主要发展方向。在交换结构中,当两个或两个以上的
配网自动化是坚强智能电网建设的重要工作内容之一,配网通信系统是配网自动化的关键组成部分,配网通信系统的可靠性是保证配网自动化系统正确运行的必要条件。作为一种光接入
随着城市化进程的加快,为解决愈发严峻的城市交通问题,具有安全可靠、环保、成本低等众多优点的现代有轨电车逐渐受到人们的重视,现代有轨电车正在成为智能交通系统中重点发
随着移动互联网的普及,无线网络服务将从目前的以话音服务为主逐渐向提供高速数据接入方向转变,传统的单跳网络结构面临一系列挑战,Mesh、Relay等分布式无线通信技术逐渐成为