论文部分内容阅读
自从人类可以制造和使用各种机器以来,人们就有一个理想,那就是让各种机器能听懂人类的语音并能按人的口头命令来行动,从而实现人机的语言交流。随着科学技术的不断发展,语音识别(Speech Recognition)技术的出现,使人类的这一理想得以实现。语音识别识别技术就是让机器通过识别和理解把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科,它正逐步成为信息技术中人机接口的关键技术,语音技术的应用已成为一个具有竞争性的新兴高科技产业。当今,语音识别产品在人机交互应用中已经占到越来越大的比例。 本文首先介绍了语音识别的定义、分类、方法、意义及国内外发展状况,并简要说明了语音识别的基本原理。 其次,根据语音识别系统的基本原理构成模型,介绍了预处理、端点检测到模板生成及模板管理和模板匹配各部分所涉及到的语音数字信号处理、模式识别等方面的基本原理。 接着,本文介绍了使用Visual C++6.0和MATLAB,根据DTW(动态时间弯折)模型的语音识别训练和识别的基本方法,在Windows操作系统上实现的一个简单的特定人、小词汇量、孤立词语音识别系统。系统的组成模块与语音识别系统的基本构成模型基本一致,在训练过程中,从语音库中的波形文件中读取采样数据,分帧计算出由LPCC、MFCC倒谱系数构成的特征矢量,并按照鲁棒性训练法进行训练,得到后续语音识别时需要的模板,存放于模板库中。识别时,计算出输入语音的特征矢量参数,依据模板匹配的方法与模板库中的语音模板逐一进行比较,得出最佳匹配模板。然后对凌阳单片机作了详细介绍后,将程序下载到凌阳单片机中,由单片机发出电信号给控制板,然后通过控制板来实现控制玩具小车的运转。 最后对系统性能进行了小结,指出了该系统的改进方向。通过对实际语音识别系统的测试和研究,为进一步开发实用性语音识别系统做了基础性的研究工作。