语音检索中识别错误处理研究

来源 :北京邮电大学 | 被引量 : 5次 | 上传用户:detectivexiat
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今语音识别技术迅速发展,在很多领域得到应用,语音检索技术也应运而生。但由于噪声、口音、语速以及集外词等原因,语音识别的结果中难免会包含许多的错误信息,这将严重影响语音检索的召回率和准确率。本文针对语音检索中语音识别出现的错误,利用混淆矩阵,从错误校正、模糊检索等方面进行容错处理,来提高语音检索的性能。主要工作与创新包括以下几个方面:1.研究了传统的混淆矩阵生成算法及应用。主要研究了从1-best和混淆网络中统计混淆概率的混淆矩阵生成算法。并将混淆矩阵用于错误校正中,实验表明,使用混淆矩阵进行候选扩展,能有效的提高正确结果的召回率。针对语音识别中出现的错误,检索时采用基于混淆矩阵的模糊匹配策略,实验表明,混淆矩阵能有效的召回识别错误的待查询词,提高召回率的同时保证了识别精度。2.提出了一种基于相邻词权重的混淆矩阵生成算法。传统的混淆矩阵生成算法,容易受到对齐错误和识别结果中错误传导的影响,导致统计出的混淆概率不精确。本文利用编辑距离和从已有混淆矩阵中获取混淆概率的方法来判定相邻词的识别情况,并据此为待统计词设定相应权重,保证统计混淆概率的精确度。实验表明,这种方法有效的提高了混淆矩阵的精确度。3.研究了基于混淆网络的混淆矩阵改进算法。针对混淆网络中包含的多候选,本文通过按照识别结果对错区分选择候选项、设定后验概率的阈值、以及加入时间重叠度和声学得分作为权重等多种方法,分别进行对比实验,找到了相对准确的混淆项选取策略。
其他文献
由于企业管理对于会计的要求在不断地提升,管理会计和财务会计因此而逐渐地融合在一起,二者之间相互融合、互相补充,进而能够得到更多的管理信息并且可以让信息变得更加明确
数字图象压缩技术被应用到多媒体、通讯、医学等等各个领域,在未来的科技领域,它仍然显示出其强大的生命力和发展潜力。静止图象压缩不但是各种动态图象压缩、传输的基础,而且,还
王安石(公元1021-1086年),字介甫,号半山,北宋时期杰出的政治家、思想家、文学家;抚州临川人(今江西抚州).进士出身,曾任地方官多年.公元1068年,召为翰林学士侍讲.次年任参知
期刊
随着社会经济市场结构的不断调整,我国各个企业面临的市场竞争力日渐激烈.房地产企业属于资金高度密集的企业,其具有投入成本高、经营风险大以及经济收益高的特点,现已成为推