论文部分内容阅读
语音识别是当今人工智能领域的研究热点,目前,它越来越广泛地应用于社会生活的各个方面,提高了人机交互性,发挥了很好的社会效益。然而在实际环境中存在着很多不利因素影响着识别系统的性能,语音识别的鲁棒性问题受到了研究者的广泛关注。数字形态滤波器是从数学形态学发展出来的一种重要的非线性滤波技术,它在图像分析与处理、计算机视觉等领域获得了广泛的应用。近年来,形态学滤波逐渐被推广到一维信号处理领域,由于其良好的滤波性能,人们也开始探索它在语音处理方面的应用。 本文重点集中于数学形态学在一维语音信号处理中的研究。依据数字语音信号的特点,设计了用于语音处理的形态学滤波算法。实验结果表明,形态学滤波能有效地抑制噪声的干扰,对混噪语音质量的增强效果显著。进而,将形态学滤波引入到语音识别当中,提出了一种基于数学形态学的抗噪声语音识别新方法。该方法使用形态滤波器去除待识别语音中的噪声,提取出尽可能纯净的原始语音信号;并且在模板训练之前加入了相同的形态学滤波预处理,以减小待识别语音经滤波去噪后引入的失真对识别系统所带来的不利影响。通过性能分析和比较,可以看出该方法在一定程度上提高了训练和测试环境的匹配性,能有效改善识别系统的抗噪声性能。 文中构建了采用MFCC特征矢量的基于连续混合高斯HMM模型的孤立词识别系统,同时还引入了上述基于数学形态学的语音识别技术。语音识别实验证实,基于数学形态学的识别方法具有良好的抗噪性,在不同的信噪比下该方法使得识别系统的识别率都有显著提高。