论文部分内容阅读
语音信号在产生、传输和接收过程中不可避免地受到各种干扰噪声的影响。噪声会严重地影响语音的清晰度与可懂度,甚至会降低语音处理系统的性能。为了提高受到噪声污染的语音信号的质量,就需要对带噪语音信号进行降噪处理。语音增强算法根据可用信号源的数目分为单通道语音增强和多通道语音增强。本论文主要对单通道语音增强算法进行了研究,并将其中的一些算法进行了DSP实时实现。本文对自适应滤波语音增强算法和短时谱估计语音增强算法两类单通道语音增强算法进行了重点研究。自适应滤波法主要研究了RLS算法和卡尔曼滤波算法两种语音增强方法。RLS算法采用了一种改进的可变遗忘因子,并且采用了ⅡR滤波器结构,从而能够在滤波器阶较小的情况下实现非平稳环境中的语音增强。另外一种自适应滤波方法是卡尔曼滤波语音增强算法。卡尔曼滤波语音增强算法是一种基于语音信号全极点模型的算法,本文主要对模型激励方差的估计进行了研究。短时谱法研究的重点是语音及噪声的短时谱估计问题,噪声功率谱估计是短时谱估计语音增强的关键。为了改善非平稳环境中噪声功率谱估计的性能,本文采用了一种新的噪声估计算法,该算法的跟踪速度比其它算法都要快,而且不需要专门的语音激活检测器。基于短时谱估计的语音增强算法需要对语音的先验信噪比进行估计,本文对信噪比估计进行了修正,消除了信噪比估计的延迟。基于短时谱估计的语音增强算法增强后的语音具有明显的谐波失真,为了对这一缺点进行改进,引入一种谐波重建语音增强技术对降噪后的语音进行处理,实现了谐波的重建。本文算法在TI公司生产的TMS320C6713 DSP平台上进行了实时实现。在DSP实现时采用了一种Ping-Pong缓冲结构对输入输出数据进行缓存,采用该缓冲结构的优点就是能够很轻松地实现实时处理。