论文部分内容阅读
语音转换就是在保证语义不变的前提下,将表征源说话人的个性化特征经过某种映射,使合成后的转换语音听起来像是目标说话人发出的一样。语音转换涉及语音数字处理领域的各个方面,并对这些领域有着促进作用,同时该项技术在数字化娱乐、保密通信、医疗等方面具有广阔的应用前景。因此,语音转换课题的研究具有重大的理论和实用价值意义。 本论文根据人的发声机理入手,将个性化特征有声道特征和激励特征两部分进行研究,采用基于STRIAGHT算法的语音分析/合成平台实现对源—目标说话人的语音转换系统研究,并通过MATLAB进行仿真和对试验结果进行多角度分析和讨论。本论文完成的主要内容包括: (1)研究了说话人的发声模型,对不同说话人的声道模型参数和激励源模型参数进行分析对比,选取线谱对系数和基频轨迹参数用于转换的语音特性特征。 (2)引入基于STRIAGHT算法的分析合成模型,针对该模型从声音特征参数的分析到合成中涉及的关键技术及步骤,做了详细的说明,并进行仿真以进行验证。 (3)分别对STRIAGHT谱和基音轨迹进行映射规则的求取,对STRIAGHT谱的转换采用改进的子空间映射法,通过加权K均值法—GMM对源说话者的进行分类器建模,使得转换矩阵的精确度提高;对基音轨迹的转换,采用均值—方差转换法,获取源—目标基音轨迹映射关系。 (4)通过MATLAB仿真实现源—目标说话人语音转换系统,分别就GMM的混合度、算法比较和性别差异三个方面对本文提出的算法进行评价并讨论分析,最后给出一个转换示例。