论文部分内容阅读
目前大多数语音识别系统在试验室环境条件下已经具有了较高的识别率,但是要在嵌入式系统上实现语音识别功能还受到诸多因素的影响,诸如它还存在着运算速度较慢、存储空间有限、实时性要求较高等突出问题。因此为了使语音识别技术能够逐步从试验室演示阶段走向实际应用阶段,我们有必要对嵌入式语音识别算法作进一步深入的分析和研究。本文主要以小词汇量嵌入式语音识别技术为基础展开讨论,并将嵌入式语音识别算法的研究和实现作为系统设计的核心,完成的工作有:首先研究了基于美尔频率倒谱系数(Mel Frequency CepstrumCoefficient,简称MFCC)的嵌入式语音识别特征提取算法,它根据人耳听觉特性原理,将线性频谱转化为基于Mel频率坐标的非线性频谱,然后通过对数运算和离散余弦变换(DCT)等环节转换到倒谱域,试验表明采用了能量参数和动态差分参数等优化措施以后,对系统整体的识别性能和识别精度都有所提高。其次研究了基于隐马尔可夫模型(Hidden Markov Models,简称HMM)的嵌入式语音识别模式匹配算法,主要包括三个部分:由模型产生观察序列的“前向-后向算法”,求取最佳状态序列的Viterbi解码算法,模型参数训练估值的Baum-Welch算法,试验证明采用HMM建模方式能够很好的描述语音信号时变性和短时平稳性特点。接下来文章讨论了嵌入式算法实现的硬件平台和外围设备控制接口,系统硬件平台选用的是德州仪器公司(简称TI)最新推出的一款针对便携式数据终端而设计的产品OMAP5912,该产品结合了高性能的TMS320C55xDSP内核和低功耗的ARM926EJS内核,可以满足嵌入式算法开发的需要,另外文章还重点论述了构建一个完整嵌入式系统开发环境的全部过程,主要包括:构建嵌入式系统引导程序U-Boot,开发MontaVistaLinux嵌入式操作系统,设计JFFS2文件系统等。文章最后主要论述了嵌入式图形用户界面(GUI)的设计和实现过程,先后完成了对MiniGUI源代码的编译和移植工作,实现了基于MiniGUI-Lite服务器的图形用户界面应用程序的开发工作,并且成功设计出具有命令行控制功能的语音识别图形显示界面,从而构建起一个较为完成的嵌入式语音识别系统。