电话语音的频带扩展

来源 :苏州大学 | 被引量 : 0次 | 上传用户:donny0325
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,在大多数通信系统中,所传输的语音信号的带宽一般都小于4 kHz。在这种情况下,窄带语音质量与相应的宽带语音质量相比有很大差距。宽带语音编码技术虽然提高了语音质量,但是也提高了对通信系统的要求。由于历史和经济上的原因,在短期内不可能完全改变现有的通信系统。一个可行且容易实现的方案就是在电话网络接收端通过重构宽带语音的方式来扩展电话信号的带宽。从窄带信号重构宽带信号的过程叫电话语音的频带扩展。电话语音频宽扩展算法大致可以分为训练阶段和扩展阶段。在训练阶段,通过语音训练使用数学方法模拟语音信号声学特征参数的映射函数;在扩展阶段,根据映射函数比对测试语音,从而转换得到合成语音。本文主要研究基于码本映射的电话语音带宽扩展算法。该算法包括窄带语音的特征提取、谱包络扩展和激励扩展等模块。本文主要工作如下:(1)在语音特征参数方面,详细介绍了MFCC/LPCC/LPC/LSF的提取方法。比较MFCC/LPCC/LPC作为窄带特征参数在电话语音带宽扩展性能方面的优缺点,并根据实验数据选择合适的特征参数。(2)介绍了目前主要的带宽扩展方法,比较码本映射、线性映射和统计映射之间的优缺点。在此研究基础上,本文提出了基于码本映射的带宽扩展改进算法。该算法优化了码本结构和提高了搜索效率。(3)分析了主要的宽带激励模型,从谱失真角度比较合成语音分别在白噪声激励模型和谱折叠激励模型下的合成效果。在此研究的基础上,本文采用基于采样率转换的谱折叠宽带激励模型,有效地减小了由谱折叠引起的频带失真带宽,显著地提高了合成语音的质量。(4)建立基于码本映射的带宽扩展系统,采用客观和主观两种评测标准来评估系统性能。从码本容量和窄带特征矢量(MFCC/LPCC/LPC)两个角度,分别测试合成语音的失真度,通过客观评测数据评估了系统性能。主观测评采用MOS评分,评测系统性能。
其他文献
在“移动宽带化”的趋势下,为对抗WiMAX系统的竞争3GPP启’动了LTE(Long Term Evolution, LTE)系统的研究。LTE系统的标准采用OFDM(Orthogonal Frequency Devision Multiple
随着无线通信技术的快速发展,以及大数据信息传输需求的急剧增加,在各无线通信领域,尤其是宽带卫星通信系统中,高速数据传输带来了多速率处理及系统同步等多方面的问题。针对
随着互联网的迅速发展,越来越多的人涌入虚拟互联网络社区去寻求人与人之间的紧密关系,因此促进建立与加强人群关系的学科技术成为热门研究内容。SNS社区网络服务以其真实性,
多媒体技术的不断发展和视频压缩国际标准的出现,给各种视频应用带来了广阔的前景,H.263基于低比特率的压缩标准,也得到了广泛的应用。论文主要实现了基于ARM9平台的H.263编
移动跟踪定位空间信息服务(Geographic Information Service, GIS)是移动地理信息系统的一个新兴应用领域。它是结合地理信息系统与嵌入式硬件,无线通信网络技术,定位技术的
随着信息技术的飞速发展,越来越多信息需要通过互联网络来传输、交换和存储,信息的安全问题成为了计算机研究的重点。由于数字图像比较直观,能够被人们所接受,并且在传输的过
人脸识别技术因为涉及较多的研究领域以及应用场景广泛成为当前一个热门研究课题,它无论在科研还是在商用中都具有重要的价值。目前经历了几十年的发展已经有大量的研究人员
正交频分复用(OFDM)技术是一种无线通信环境下的高速多载波传输技术,具有较高的频谱利用率和良好的抗多径干扰能力,是第四代移动通信系统的核心技术。当OFDM系统中载波频率不
目前,稀缺的频谱资源与多样化的业务需求之间的矛盾是移动通信技术所面临的最主要挑战之一。多输入多输出(MIMO)技术在信息论上的容量优势引发了空时信号处理的大量研究,但是,基