基于STRIAGHT算法的语音转换的研究

来源 :华北电力大学(北京) 华北电力大学 | 被引量 : 0次 | 上传用户:yushion
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音转换就是在保证语义不变的前提下,将表征源说话人的个性化特征经过某种映射,使合成后的转换语音听起来像是目标说话人发出的一样。语音转换涉及语音数字处理领域的各个方面,并对这些领域有着促进作用,同时该项技术在数字化娱乐、保密通信、医疗等方面具有广阔的应用前景。因此,语音转换课题的研究具有重大的理论和实用价值意义。  本论文根据人的发声机理入手,将个性化特征有声道特征和激励特征两部分进行研究,采用基于STRIAGHT算法的语音分析/合成平台实现对源—目标说话人的语音转换系统研究,并通过MATLAB进行仿真和对试验结果进行多角度分析和讨论。本论文完成的主要内容包括:  (1)研究了说话人的发声模型,对不同说话人的声道模型参数和激励源模型参数进行分析对比,选取线谱对系数和基频轨迹参数用于转换的语音特性特征。  (2)引入基于STRIAGHT算法的分析合成模型,针对该模型从声音特征参数的分析到合成中涉及的关键技术及步骤,做了详细的说明,并进行仿真以进行验证。  (3)分别对STRIAGHT谱和基音轨迹进行映射规则的求取,对STRIAGHT谱的转换采用改进的子空间映射法,通过加权K均值法—GMM对源说话者的进行分类器建模,使得转换矩阵的精确度提高;对基音轨迹的转换,采用均值—方差转换法,获取源—目标基音轨迹映射关系。  (4)通过MATLAB仿真实现源—目标说话人语音转换系统,分别就GMM的混合度、算法比较和性别差异三个方面对本文提出的算法进行评价并讨论分析,最后给出一个转换示例。
其他文献
随着民用航空的发展,用户对于航空通信服务的要求也在不断提高。然而,在航空通信中,高多普勒频移导致信道产生时变衰落,子载波之间相互干扰,同时,大时延使得信道呈现频率选择性衰落,信号发生符号间干扰,以上两个问题严重降低了系统性能。因此,获取准确的信道状态信息和消除多普勒频移干扰成为提升通信质量的两大关键技术。目前,常见的信道估计算法和多普勒频移估计算法在提高估计精度的同时伴随着计算复杂度的增加,且缺乏
学位
协作分集技术通过多用户共享彼此的天线来形成虚拟MIMO系统,克服多径衰落的同时获得分集增益。网络编码技术通过节点对多路信号的编码处理,提高了无线通信系统的吞吐率的同时提
多描述视频编码是一种有效的传输差错控制技术,它可以在无线信道中实现鲁棒性传输。多描述编码将信息源分成多路描述,每个描述通过相互独立的信道进行传输且都有恢复整幅图像的
无线传感器网络作为一种信息采集平台,具有高监测精度、高容错性能、可远程监控等优点,有着广阔的应用前景。由于传感器节点能量有限,直接影响网络的生命周期,因此,如何高效地利用
近些年,三网融合在大中型城市中逐步开展,有线电视运营商和网络运营商纷纷推出各自的三网融合技术方案。其中,国家广电总局下发的2013年1号文件-《广电总局关于促进主流媒体发展
随着互联网技术的快速发展,现有互联网也逐渐暴露出在安全性、移动性和路由可扩展性等诸多方面的问题。上述问题的根本原因在于传统互联网中IP地址对身份信息与位置信息的绑
伴随着我国高速铁路的迅猛发展,高速列车运行的安全性也愈发得到了重视。应答器传输模块(Balise Transmission Module,BTM)作为列车自动保护(Automatic Train Protection,ATP
随着无线局域网(WLAN)的快速发展,终端接入无线信道的竞争将变得更加激烈,而现有的请求发送/清除发送(RTS/CTS)信道接入方式不能够有效地解决高并发网络中的信道接入问题。为了提高
目前,我国采矿业进入到了智能开采的阶段。我国是矿业大国,但不是矿业强国。当前能源产能过剩,传统的粗放型开采已经不适合我国。急需智能化系统和高安全性平台来改善当前的
分划板作为测量标记和计量刻度工具对光学测量有重要作用,但随着系统成像,分划板上的刻度分划线也留存在采集到的图像上,对后期的图像处理带来了不利影响。本文围绕着如何去