论文部分内容阅读
随着人工智能技术的蓬勃发展,作为人机交互接口的语音识别技术也受到国际各界学者的广泛重视。目前商用的语音识别系统在室内高信噪比环境下已经取得了较高的识别率,但对于室外的环境,系统的识别率则表现不佳。本文通过探寻语音识别系统对噪声的自适应性以及引入马尔科夫和人工神经网络混合模型的方法,初步建立了一个较为完善的语音识别自适应模型,能够提高复杂环境下的语音识别率,增强语音识别系统的稳健性及自适应性。 本文主要做了如下工作: 1.针对倒谱距离语音端点检测算法存在的问题,通过计算每帧语音信号的短时信噪比,确立信噪比与门限阈值的关系,建立了一种自适应判决门限的双参数判决准则,能够精准的检测出语音端点信号,改进后的算法具有一定的自适应性,语音信号端点检测准确率有所提升。 2.针对谱减法语音增强技术容易产生音乐噪声的问题,引入了SNR与谱减因子关系模型,通过关系模型动态调整谱减因子及语音增益系数,在最大限度抑制音乐噪声产生的前提下,提升语音信噪比,增强系统的抗干扰能力和鲁棒性。 3.分析了马尔科夫模型和人工神经网络模型的优缺点,通过调整神经网络的连接权值、缩放系数和位移参数,提升了网络模型的收敛速率。 4.结合马尔科夫模型强大的时序建模能力和人工神经网络模型的分类功能,建立了一个马尔科夫模型与人工神经网络模型混合结构的语音识别系统,在低信噪比环境下,该系统依旧能够保持较高的语音识别率。