论文部分内容阅读
数字语音通信尤其是基于IP网络的语音通信的普及让人们对通信过程中的音质问题更加重视。本文在分析影响音质的各种因素的基础上,提出了一套包括发送端和接收端两侧的音质增强算法,涉及到实时的去混响,扬声器频响均衡以及动态范围压缩算法。并提出了一种改进的非侵入式语音质量评估算法对通信结点中的质量进行预测,从而保证音质增强算法能够根据应用场景进行参数调谐。首先,介绍数字语音通信系统的特性,论述了通信音质的影响因素以及进行音质提升所需要采取的工作。并以实际工程中的音频解决方案为例进行分析,为选出合适的音质增强算法以及算法实现结构提供理论和现实基础。其次,以基于IP网络的语音通信为背景,对各个算法模块展开阐述分析,并比较不同算法之间的效果,对比得出适用于实时应用且效果可期的方案。其中,在发送端去混响算法是在研究了分块谱减的基础上,提出的一种能够与回声消除结合的方案。对于接收端分别研究了扬声器的频响补偿和信号幅度的动态范围控制算法。其中,对扬声器系统以最小相位分解的方式来解决逆滤波算法中系统不稳定的问题。对信号幅度的调整是将语音活动检测与动态范围控制结合设计了五段的增益曲线,从而实现了接收通道的降噪,增益控制和限幅保护功能。并在Matlab上对算法模块进行模型的仿真,详细分析其性能。然后,基于QoS提出了一种改进的非侵入式语音质量评估算法,以梅尔倒谱系数及其差分系数的均值和方差作为特征,通过最大期望算法训练混合高斯模型来进行实时的通信结点的语音质量预测。以期其作为参考对音质增强算法进行参数调谐。最后将提出的语音质量评估算法与标准方案ITU-T P.563对比,并基于此算法对前述的音质增强方案进行客观MOS评分。对算法的运行效率和执行效果进行总结后,得出算法运行的结果能够达到预期且可以应用于实时的处理平台。在论文的结束指出了进一步研究的方向。