论文部分内容阅读
当今语音识别技术迅速发展,在很多领域得到应用,语音检索技术也应运而生。但由于噪声、口音、语速以及集外词等原因,语音识别的结果中难免会包含许多的错误信息,这将严重影响语音检索的召回率和准确率。本文针对语音检索中语音识别出现的错误,利用混淆矩阵,从错误校正、模糊检索等方面进行容错处理,来提高语音检索的性能。主要工作与创新包括以下几个方面:1.研究了传统的混淆矩阵生成算法及应用。主要研究了从1-best和混淆网络中统计混淆概率的混淆矩阵生成算法。并将混淆矩阵用于错误校正中,实验表明,使用混淆矩阵进行候选扩展,能有效的提高正确结果的召回率。针对语音识别中出现的错误,检索时采用基于混淆矩阵的模糊匹配策略,实验表明,混淆矩阵能有效的召回识别错误的待查询词,提高召回率的同时保证了识别精度。2.提出了一种基于相邻词权重的混淆矩阵生成算法。传统的混淆矩阵生成算法,容易受到对齐错误和识别结果中错误传导的影响,导致统计出的混淆概率不精确。本文利用编辑距离和从已有混淆矩阵中获取混淆概率的方法来判定相邻词的识别情况,并据此为待统计词设定相应权重,保证统计混淆概率的精确度。实验表明,这种方法有效的提高了混淆矩阵的精确度。3.研究了基于混淆网络的混淆矩阵改进算法。针对混淆网络中包含的多候选,本文通过按照识别结果对错区分选择候选项、设定后验概率的阈值、以及加入时间重叠度和声学得分作为权重等多种方法,分别进行对比实验,找到了相对准确的混淆项选取策略。