论文部分内容阅读
随着现代计算机技术和语音技术的发展,用语音和计算机交流已经成了现代科技发展的一个标志,语音识别和语音合成也因此成为现代计算机技术研究迫切需要发展的一个方向。 语音识别技术关系到多学科的研究领域,不同领域上的研究成果都对语音识别的发展作了贡献。语音信号本身的特点造成了语音识别的困难,这些特点包括多变性、动态性、瞬时性和连续性等。计算机对语音识别的过程和人对语音的识别过程基本上一致。目前主流的语音识别技术是基于统计模式识别的基本理论。 本文以最终实现一个基于HMM模型的城市道路名语音识别系统为目的,详细介绍了作者在实现高识别率的语音识别算法中的思想以及改进。论文论述了特征矢量的获取,HMM的原理和Baum_Welch算法的实现方法。并在此基础上采用了Viterbi算法,Segmental K-means算法,减少了运算复杂度,提高识别速度,使之能够满足实时性的要求。同时针对语音识别系统中识别率不高的问题,采用基音频率分析的方法分别建造男女声识别模型。并建造了基于城市道路名称(整词)的HMM和基于中文音素的HMM两种模型。论文的最后给出了这两种模型识别性能的比较结果和分析。