论文部分内容阅读
语音信号处理技术是语音处理领域中新近发展起来的一个学科分支,本文主要研究了语音信号处理技术中的两个主要内容:语音时长规整技术和说话人特征改变技术。语音时长规整技术就是在不改变语音音调并保证良好音质的前提下,随意地改变语音播放速度,就仿佛说话人自己在改变说话速度一样。说话人特征改变技术是语音处理中一个比较新的交叉边缘分支,主要是通过对合成语音进行适当语音参数控制和调整来实现的。针对语音时长规整技术,研究了固定同步重叠叠加(SOLAFS)算法中合成相邻帧间距ss和搜索总长度kmax的最佳参数选取,实验表明ss的取值在不小于一个平均基音周期的同时不大于帧长与一个平均基音周期的差值;kmax的取值约为一个平均基音周期。在此基础上得出了人耳对基音同步的感知存在一定的容差从而改进了二次谱提取基频算法,提高了基频提取的准确度,进一步提出了一种新的基于改进二次谱的语音时长规整算法,与SOLAFS算法相比,该算法在保持规整后语音质量的同时,有效降低了整体计算复杂度。针对说话人特征改变技术,提出了一种基于重采样的基频改变算法,该算法简单有效,整体计算复杂度较低;提出了一种非等比例调整前三个共振峰的方法,独立调整前三个共振峰的同时保证了信号总能量不变;提出了一种男女声频谱倾斜差异补偿方法,提高了男声变女声时输出语音的自然度。融合所研究的各种特征参数改变方法,构建了基于倒谱的说话人特征改变系统。最后采用混合编程方式,实现了集语音时长规整技术和说话人特征改变技术于一体的语音信号处理软件。本软件采用VC++和Matlab混合编程的思想,利用该软件,可以实现对输入语音进行变速和变声处理两个功能。在变声处理中,可以实现男声、女声、童声和老人声等之间的快速转换,也可以手动设置特征参数,进行其他要求的语音特征改变,如同性别之间的语音特征改变等。除此之外,还可以实现现场变速变声等其他功能。