面向数字语音通信的音质增强算法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:fishingalone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字语音通信尤其是基于IP网络的语音通信的普及让人们对通信过程中的音质问题更加重视。本文在分析影响音质的各种因素的基础上,提出了一套包括发送端和接收端两侧的音质增强算法,涉及到实时的去混响,扬声器频响均衡以及动态范围压缩算法。并提出了一种改进的非侵入式语音质量评估算法对通信结点中的质量进行预测,从而保证音质增强算法能够根据应用场景进行参数调谐。首先,介绍数字语音通信系统的特性,论述了通信音质的影响因素以及进行音质提升所需要采取的工作。并以实际工程中的音频解决方案为例进行分析,为选出合适的音质增强算法以及算法实现结构提供理论和现实基础。其次,以基于IP网络的语音通信为背景,对各个算法模块展开阐述分析,并比较不同算法之间的效果,对比得出适用于实时应用且效果可期的方案。其中,在发送端去混响算法是在研究了分块谱减的基础上,提出的一种能够与回声消除结合的方案。对于接收端分别研究了扬声器的频响补偿和信号幅度的动态范围控制算法。其中,对扬声器系统以最小相位分解的方式来解决逆滤波算法中系统不稳定的问题。对信号幅度的调整是将语音活动检测与动态范围控制结合设计了五段的增益曲线,从而实现了接收通道的降噪,增益控制和限幅保护功能。并在Matlab上对算法模块进行模型的仿真,详细分析其性能。然后,基于QoS提出了一种改进的非侵入式语音质量评估算法,以梅尔倒谱系数及其差分系数的均值和方差作为特征,通过最大期望算法训练混合高斯模型来进行实时的通信结点的语音质量预测。以期其作为参考对音质增强算法进行参数调谐。最后将提出的语音质量评估算法与标准方案ITU-T P.563对比,并基于此算法对前述的音质增强方案进行客观MOS评分。对算法的运行效率和执行效果进行总结后,得出算法运行的结果能够达到预期且可以应用于实时的处理平台。在论文的结束指出了进一步研究的方向。
其他文献
改革开放以来,我国经济蓬勃发展,企业集团也早已成为很多大型企业的普遍存在形式。随着中国企业实力的不断增强,企业集团成为了众多企业选择的企业形式。企业集团的组织形式
生长激素(Growth hormone.GH)是脊椎动物下丘脑分泌的单链多肽激素,鱼类生长激素参与鱼体的生长、发育和代谢等。鱼类脑垂体中天然生长激素含量极低,分离纯化比较困难,基因工程技
扬子板块西北缘发育新元古代火成岩,自南向北依次出露碑坝、望江山、城山-毕机沟等基性层状堆晶杂岩体和大量花岗岩、花岗闪长岩体,主要侵位于古元古界后河群,中-新元古界火
本文从公立医院医用材料成本管理现状探寻与分析为出发,结合当前公立医院医用材料成本管理的重点,谈谈如何有效提升公立医院医用材料成本管理质量,并提出若干可供参考的管理
本文简单介绍了木版水印的传统面貌与当代面貌,可见木版水印的社会功能已经从实用性转为审美价值。无论是内容、材料、技法还是画面中所传达的内涵与人文精神,木版水印在新时
<正>题记:评剧形成后不久,女演员兴起。上世纪30年代初期,当时的评剧观众仿照京剧公推四大名旦的形式,把对评剧剧种贡献显著、在各地影响广泛的四位女演员,誉之为评剧四大名
含有1.9-2.5%Re,0.4-0.6%Ti的键镍钛合金是一种具有很好综合性能的高弹性材料,属于时效硬化型合金,用于航空仪表中制造动压膜盒时,对材料的成型性能,机械、弹性性能,以及尺寸精度、