基于高斯混合模型的语音转换技术的研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:linfenrir
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音转换是指改变一个人(源说话人)的语音个性特征使之具备另一个人(目标说话人)的语音个性特征,从而使源说话人的语音听起来像目标说话人的语音的一种语音处理技术。随着现代生活水平的提高,人们不再单单追求语音的可懂度,而更加强调语音的个性化特征,因此,该技术的研究不仅具有重要的理论意义,同时也具有巨大的应用价值,正逐渐成为语音处理领域的研究热点之一。 本文主要研究语音转换技术的基本理论和方法,介绍了语音发音系统和模型,语音转换的基本框架和常用的语音参数以及转换算法。重点介绍了本文所采用的LPC语音分析模型和基于GMM模型的语音频谱包络转换算法,最后研究了语音残差激励的处理方法。 本文采用LPC语音分析模型,是因为LPC模型符合语音产生原理,它可以将语音有效的分解为谱包络部分(由LPC系数表示)和激励部分(由LPC的残差表示)。对于谱包络部分,本文通过LSP参数实现谱包络的转换,通过对激励部分的处理以提高转换语音的音质,达到高质量的语音转换效果。在基于GMM模型进行谱包络的训练和转换时,本文分析并通过实验研究了GMM混合分量的个数对转换语音质量的影响,最后,给出了语音转换系统的整体设计方案,分析了转换后的语音质量。
其他文献
H.264是由ITU-T和ISO共同制定的新一代视频编码标准,与现有的视频编码标准相比,H.264不仅具有优异的压缩性能,而且具有良好的网络亲和性。然而信道中传输的压缩数据对分组丢失非
无线传感器网络节点的能源、计算能力和带宽都非常有限,传统的无线路由协议不适合无线传感器网络,设计能够有效节约能源、延长网络生命周期的路由协议成为了无线传感器网络研究
互联网的快速、健康发展使网络业务流量监测系统的重要性日益突出,它能对特定网络以及网络所承载的各类业务进行及时、准确的流量和流向分析。网络通信技术为网络业务流量监