论文部分内容阅读
小词汇量语音识别系统是指词汇量在100字以内的语音识别系统。在语音拨号电话、家电遥控、工业控制等领域,小词汇量语音识别都有着广泛的应用,具有重要的实用价值。实现高识别率的小词汇量语音识别系统并不困难,但如何解决识别率和系统复杂度的关系,是目前这一研究领域中最重要的课题之一。
本文系统的研究了组成小词汇量语音识别系统的各种技术,并在此基础上提出了一个小词汇量语音识别系统的实现方案。本文主要完成了下列工作:
(1)以分帧处理思想改进了端点检测方法,在采样期间可以进行特征提取和矢量量化,提高了系统的实时性:
(2)采用单边自相关序列代替原始语音序列,提高了线性预测倒谱参数的抗噪性能;
(3)用近邻划分的方法进行矢量量化,降低了识别过程的计算量;
(4)着眼于定点DSP处理特性,对离散马尔可夫模型的训练和识别过程提出了一 些改进方案,减少了存储量和运算量。具体方法有:用加权合并的方法对多训练序列Baum-Welch重估公式优化,用增加指数位的方法解决前后向概率递推过程中的下溢问题,以及结合Viterbi-Beam和Viterbi-Window两种剪枝算法的思路进行Viterbi判分;
(5)就系统的每个关键参数进行实验和分析,给出了小词汇量语音识别系统的实现方案,取得了识别率和复杂度较为均衡的结果。
本文的仿真系统最终性能为:孤立词特定人识别率93.0%,连续语音特定人识别率80.5%。