论文部分内容阅读
语音识别技术经过几十年的探索和研究,已经取得了一系列突破性的进展,一些成熟技术正逐渐应用于实际生活中。近年来,作为一种方便的人机交互手段,语音识别在消费类电子产品和工业控制等领域迅速发展,有着广泛的应用前景。嵌入式平台上的基于隐马尔可夫模型的非特定人、小词汇量、孤立词语音识别技术正在成为目前研究的热点之一。本文系统地研究了组成小词汇量语音识别系统的各种关键技术,在Matlab实验平台下完成语音训练和识别算法的设计,取得相关实验数据,为软硬件协同实现语音识别提供依据,并在此基础上探讨了其在FPGA上的实现问题。语音识别的理论模型对系统的构建具有指导意义,本文首先分析了语音信号的声学模型和汉语音节特点,合理地选择了音节作为语音识别的基本单元。然后详细地论述了语音识别的流程和基于Matlab的软件实验平台,并应用隐马尔可夫模型实现孤立词语音识别。隐马尔可夫模型对时间序列具有很强的建模能力,通过对时间序列特征参数的训练,为每个语音建立一个隐马尔可夫模型。待识别语音通过与各个隐马尔可夫模型匹配,即得到识别结果。它是一个鲁棒性模型,可以确保识别的高正确率,因此,广泛应用于语音识别领域。论文在Matlab实验平台上编写和仿真了预处理、端点检测、特征参数提取、矢量量化、隐马尔可夫模型训练和识别几个子功能模块,实现了语音识别的整体过程。并用汉语数字识别验证了方案的可行。同时,在对经典方法深入研究的前提下,本文还探讨将动态窗长、模糊理论等引入语音识别过程,通过对小词汇量孤立词的语音识别实验,取得了一定的效果。文章最后采用Matlab、VC++、FPGA,建立了一个软硬件协同语音识别的实验研究平台,探讨了语音识别算法在FPGA上的应用,重点考虑了基于帧的流程决策、MFCC定点计算和Viterbi算法等几个问题。结合FPGA结构特点,直接使用加法器、乘法器、比较器等建立一个Viterbi算法结构,采用改进的方法计算Viterbi得分和预计算逻辑实现了一种简单的基于隐马尔可夫模型的语音模板匹配。实验证明了该方案的切实可行。