论文部分内容阅读
自动语音识别系统在噪声环境下的鲁棒性是语音识别系统从实验室走向实际应用的关键,其主要研究目的是为了解决应用环境与训练环境之间不匹配所造成的识别性能下降问题。本文在总结和分析现有噪声鲁棒语音识别方法的基础上,重点针对信号空间和特征空间的端点检测、语音增强和鲁棒特征提取等问题进行了一定的研究,具体的工作及创新如下:首先,本文对语音信号产生的数字模型和语音识别的基本原理进行了简单介绍,并根据语音识别系统的构成将自动语音识别中的噪声鲁棒性方法按照信号空间、特征空间与模型空间进行分类总结。然后,针对语音识别中预处理阶段的端点检测算法进行了分析,在研究基于短时能量、短时过零率和谱熵的端点检测算法的基础上,提出改进谱熵端点检测算法,仿真实验的检测效果优于基本谱熵算法,具有更好的噪声鲁棒性。再者为了抑制噪声对语音信号的影响,研究了谱减法与改进谱减法。仿真实验表明,两种典型的改进谱减法能有效地改善系统输入信号的信噪比。其次,从特征空间研究了鲁棒语音识别中的特征参数提取问题,分析比较了语音识别系统中常用的三种特征提取参数,线性预测系数(Linear Prediction Coefficients,LPC)、线性预测倒谱系数(Linear Prediction Cepstral Coefficients,LPCC)和美尔频率倒谱系数(MelFrequency Cepstral Coefficients,MFCC)。构造出一种基于MFCC的鲁棒特征参数:SS-MFCC,在不同噪声环境下进行了识别实验,得到新的特征参数相对于MFCC的改善程度,验证了新参数的优良鲁棒性。最后,研究了隐马尔可夫模型,利用Matlab建立了一个基于HMM模型的语音识别系统。实验表明,综合各部分的算法建立起来的语音识别仿真系统,在信噪比为10dB的白噪声条件下对汉语数字0-9的识别率能达到83.75%,具有良好的鲁棒性。