基于正弦模型的参数语音合成研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:cngvr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着语音合成技术的不断发展,基于HMM(Hidden Markov Model)的参数语音合成方法逐渐成为当前的一个研究热点。这种方法具有合成语音平滑流畅、系统构建自动化程度高、存储尺寸小、模型灵活性强等优点。但是由于参数合成器的使用,其合成语音的音质相对传统的单元挑选与波形拼接方法存在一定的不足。在这种背景下,一种对语音有较好的分析能力、较高的合成质量、较快的分析速度和较强的韵律调整能力的参数语音合成器具有十分重要的意义和极高的实用价值。 本文对基于正弦模型的参数分析合成器进行了系统和深入的研究,改进了正弦分析合成器的各项性能。具体的研究工作如下: 第一:对传统正弦模型进行分析和改进,提高了正弦参数提取的准确度和运算效率。引入STRAIGHT分析中去除周期影响的谱估计思想,在最小均方误差准则(MSE)下,通过矩阵计算,去除了分析窗的影响,从而使各正弦分量的幅度和相位能够被更加准确的提取出来。对正弦参数分析方法中的矩阵运算流程的进一步研究与改进,极大的提高了分析端正弦参数提取和谱估计的效率。改进后的正弦分析算法无论在恢复语音的音质还是在运行效率上都超过了目前最常用的STRAIGHT分析算法。 第二,针对语音的相位卷绕和平滑问题开展了深入的研究,提升了正弦模型的韵律调整能力。引入去除激励线性相位的方法解决相位卷绕问题,并尝试使用不同的线性相位估计方法达到最佳的相位谱平滑效果,从而使正弦合成器获得了比较良好的韵律调整能力。在合成端通过加入帧对齐方法,一方面解决了调整带来的相位不连续问题,一方面进一步改善了去除线性相位的效果。 最后,首次将正弦模型与基于HMM的可训练合成系统(HMM-based Trainable TTS)相结合,建立了一个完整的可训练参数合成系统。对该系统下正弦模型的参数建模和训练算法进行了探索性研究。提出参数直接建模和包络建模两种方法,并针对正弦参数和幅度谱、相位谱各自的特点对建模算法做出改进。验证了正弦模型与基于HMM的可训练参数合成系统相结合的可行性,为下一步工作奠定了基础。
其他文献
基于Internet的远程控制机器人系统结合了传统的机器人控制技术和先进的网络通信技术。它可以被应用于危险环境下的远程作业、远程医疗、远程教学、远程监护以及传统生产模式
如今通信与信息资源的高效利用已经变得越来越重要。处于信息技术发展核心地位的数据中心,也正在通过降低设备成本、简化数据中心网络管理、提高资源利用率等方法,缓解因规模
移动通信网是一个不断变化的网络,网络结构、无线环境、用户分布和使用行为都在不断的变化,需要持续不断的对网络进行优化调整以适应各种变化。网络优化是一个长期的任务,它
随着无线业务的发展,人们对无线网络服务质量的要求也越来越高。同时,随着集成电路的发展,尽管用户终端的功能越来越丰富,但是其小型化程度却越来越高,这影响多天线等提高网络容量
随着经济的发展,人民生活水平的提高,汽车数量的增长速度远远超过道路基础施建设的速度,城市公路交通系统的压力不断加大,智能交通系统作为一种新的交通管理技术,受到全世界
测向技术伴随着雷达的出现而发展,早在二战前就已经应用到雷达中,如今已经是雷达、声纳、通信、地震勘探、射电天文等领域的关键技术之一。传统方法较为简单,但精度无法满足现实
本文首先分析了国内外微型飞行器(MAV)研究现状、发展趋势和存在的困难,接着阐述了MAV的系统结构,针对已有的MAV平台,设计了MAV自主飞行控制系统的总体方案,选择ARM作为中央
传统网络中,网络主要固件被各设备厂商锁定与控制,协议实现也与硬件绑定,各自只是针对某个问题工作,互相独立互不干扰。这与目前网络需求非常不符。人们需要能够对网络有更大
随着社会信息化的不断发展,新兴的GPS技术不断提高,移动通信技术广泛普及,两者的结合受到了越来越广泛的应用,特别是在公安系统等特种行业中。在公安系统侦察过程中,在打击犯
纠错码理论的中心任务是设计出编码效率高、抗干扰性能好而编译码设备又较简单的纠错码。本文主要关注纠错码中的线性分组码,因为线性分组码是分组码中最重要的一类码,是讨论