论文部分内容阅读
近年来,语音识别技术在渐渐改变人们的生活和工作方式,可以用来消除人类之间交流的障碍,也能够极大地提升人机交互的能力。日前,DTW、隐马尔可夫和神经网络等方法都可以用来实现非特定人的语音识别。本文对隐马尔科夫模型(HMM)和BP神经网络算法进行了深入地研究,结合隐马尔可夫模型较好的时序建模能力和BP神经网络技术强大的分类能力,提出了HMM和BP神经网络混合模型的语音识别方法,使用MATLAB编程来实现算法。将混合模型与传统的隐马尔可夫和BP神经网络模型进行分析和对比,实验结果说明混合模型应用于非特定人汉语语音识别能够有效地提高语音识别率,并具有一定的抗噪性。 本文围绕非特定人领域的汉语语音识别展开了研究,论文的主要研究内容包括: (1)研究并分析了语音识别的发展历史和国内外语音识别技术研究现状,深入学习语音识别的基本原理。 (2)研究了语音信号预处理的全过程,包含对原始语音信号的采集、去噪处理、预加重、分帧加窗和端点检测,分析了语音信号不同的特征参数,选取美尔频率倒谱系数(MFCC)作为本文所用特征参数。 (3)介绍了隐马尔科夫模型三个基本问题及其求解算法,在语音识别中的应用,并分析了其所存在的问题和不足。 (4)研究了BP神经网络模型的原理和基本结构,以及其在语音识别中的应用,分析了算法在语音识别应用中的优缺点。 (5)设计了隐马尔科夫模型和BP神经网络模型相结合的混合模型,有效地解决传统模型中BP神经网络收敛速度慢,HMM相似词容易混淆的缺陷,完成并实现非特定人汉语语音的识别。