论文部分内容阅读
目前,在大多数通信系统中,所传输的语音信号的带宽一般都小于4 kHz。在这种情况下,窄带语音质量与相应的宽带语音质量相比有很大差距。宽带语音编码技术虽然提高了语音质量,但是也提高了对通信系统的要求。由于历史和经济上的原因,在短期内不可能完全改变现有的通信系统。一个可行且容易实现的方案就是在电话网络接收端通过重构宽带语音的方式来扩展电话信号的带宽。从窄带信号重构宽带信号的过程叫电话语音的频带扩展。电话语音频宽扩展算法大致可以分为训练阶段和扩展阶段。在训练阶段,通过语音训练使用数学方法模拟语音信号声学特征参数的映射函数;在扩展阶段,根据映射函数比对测试语音,从而转换得到合成语音。本文主要研究基于码本映射的电话语音带宽扩展算法。该算法包括窄带语音的特征提取、谱包络扩展和激励扩展等模块。本文主要工作如下:(1)在语音特征参数方面,详细介绍了MFCC/LPCC/LPC/LSF的提取方法。比较MFCC/LPCC/LPC作为窄带特征参数在电话语音带宽扩展性能方面的优缺点,并根据实验数据选择合适的特征参数。(2)介绍了目前主要的带宽扩展方法,比较码本映射、线性映射和统计映射之间的优缺点。在此研究基础上,本文提出了基于码本映射的带宽扩展改进算法。该算法优化了码本结构和提高了搜索效率。(3)分析了主要的宽带激励模型,从谱失真角度比较合成语音分别在白噪声激励模型和谱折叠激励模型下的合成效果。在此研究的基础上,本文采用基于采样率转换的谱折叠宽带激励模型,有效地减小了由谱折叠引起的频带失真带宽,显著地提高了合成语音的质量。(4)建立基于码本映射的带宽扩展系统,采用客观和主观两种评测标准来评估系统性能。从码本容量和窄带特征矢量(MFCC/LPCC/LPC)两个角度,分别测试合成语音的失真度,通过客观评测数据评估了系统性能。主观测评采用MOS评分,评测系统性能。