论文部分内容阅读
语音识别技术已经取得令人鼓舞的成就,市场上也出现了许多相对成熟的语音识别产品,但是大部分语音识别系统仍局限于特定的环境,距离真正的实用化还相差很远。本文以提高语音识别系统的鲁棒性为目标,进行了相关的实验和研究。本文主要内容为语音信号处理,包括特征提取分析和模式识别,介绍国内外这一领域的研究成果和进展,针对其中的问题提出自己的解决方法和思想,并实现了一些相关的算法。第一章为引言,介绍论文研究的背景意义和国内外的研究现状。第二章为研究方法和技术的介绍,主要是神经网络基础知识。第三章为语音信号的特征提取和分析,介绍了各种常用的语音特征参数以及特征分析的方法与工具,给出特征提取过程中一些问题的解决方法和算法,第四章为神经网络识别部分,对语音识别中常用的几种神经网络模型进行了分析和比较。第五章是论文的总结。主要内容包含如下:语音识别的基本概念、发展历史和现状。人工神经网络的主要原理和概念以及在语音识别中的应用。语音识别系统一般由特征提取和模式识别这两个模块构成。特征提取阶段主要使用线性预测编码技术从语音信号中提取特征向量。采样和量化完成语音信号的数字化过程;语音特征分析分为时域分析和频域分析,时域分析常用的特征参数有短时平均能量和短时过零率,短时傅立叶分析、线性预测编码和倒谱分析则是三种常用的频域分析方法;语音信号特征提取中的端点检测问题以及检测方法的分析比较;提出清浊音检测问题的一种解决方法并在基于Matlab 的环境下实现了算法,实验分析算法的性能;分析汉语数字语音的基频和共振峰特征;讨论语音特征参数的噪声鲁棒性和语音信号的情感特征参数。神经网络应用于语音识别的模式识别阶段。首先是网络模型的训练和学习过程,调整好的网络模型就可以应用于识别了。多层感知机以及反向传播算法在语音识别中应用广泛;时间延迟神经网络可以很好地适应语音信号频谱参数的时变性,使用的训练算法也是反向传播算法;循环神经网络是一种既有前馈通路,又有反馈