连续语音识别解码技术的研究

来源 :解放军信息工程大学 | 被引量 : 10次 | 上传用户：zhang514409411

【摘要】

：

解码器是连续语音识别系统中最能直观反映系统性能的重要组成部分。解码技术的研究目的就是要优化解码过程,使解码器能够在得到较高精度识别结果的同时有着较快的识别速度。

【作者】

：

尹明明

【出处】

：

解放军信息工程大学

【发表日期】

：

2011年01期

【关键词】

：

连续语音解码剪枝阈值语言模型权值插入代价最小化词错误率解码词图混淆网络重打分

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

解码器是连续语音识别系统中最能直观反映系统性能的重要组成部分。解码技术的研究目的就是要优化解码过程,使解码器能够在得到较高精度识别结果的同时有着较快的识别速度。本文围绕如何保持解码精度与速度之间的均衡,重点对一遍解码中解码参数的优化以及二次解码过程展开深入研究,主要工作概括为以下四个方面:(1)研究了全局阈值、词尾阈值、激活模型数、令牌数四维剪枝阈值参数的优化,提出了一种多维剪枝阈值参数联合优化的算法。该算法针对目前单一剪枝阈值优化的算法没有考虑到多维阈值参数之间互相影响的问题,首先应用多目标优化理论对阈值参数进行联合优化,然后根据优化结果,采用分段动态阈值的方法进行后处理。实验结果表明,采用新方法优化之后的阈值参数进行一遍解码,解码器的剪枝性能得到明显改善,在保持较高解码精度的同时,大大提高了解码的速度。(2)研究了语言模型权值与插入代价两维解码参数的优化,提出了一种基于词图重估的解码参数优化算法。该算法针对优化过程中参数收敛速度过慢的问题,采用线性搜索与模拟退火搜索相结合的方法对参数空间进行搜索,提高了优化速度,并能使得优化后的参数具有全局最优和对初值稳定性强的优点。实验结果表明,相对于经典的N-Best算法优化,新方法优化的识别速度有所提升,且使用优化后的参数进行一遍解码能更有效降低基线系统词错误率。(3)研究了生成混淆网络实现最小化词错误率解码的过程,提出了一种局部路径对齐的混淆网络生成算法。该算法针对当前主流混淆网络生成算法速度与精度不能兼顾的问题,每次从词图中提取局部路径与基准路径对齐,有效解决了最大后验概率弧对齐算法生成的混淆网络混淆集顺序颠倒的问题;在对齐过程中,根据局部路径与参考路径长度的不同,采取不同的处理方法,也解决了轴对称算法的对齐错误。实验结果表明,新算法生成效率与主流的算法相当,但是其生成混淆网络的解码性能相对于主流算法有所提高。(4)研究了重打分算法,提出了一种基于词图的递归重打分算法。该算法首先把词图变换为一种类似于位置确定的后验概率词图结构,这种结构中的弧只包含声学得分,然后采用该算法搜索出最优结果。与传统的Viterbi重打分的算法相比,新方法无需将知识转化为有限状态机融入到搜索网络中,因此更易结合高层语言学知识进行重打分。实验结果表明,新算法相对于Viterbi搜索的算法,搜索空间大小急剧减少,能很好满足二次解码对速度的要求,且能保持较高的识别精度。

其他文献

多酚类化合物——丹宁酸用作锂金属负极电解液成膜添加剂

金属锂因具有高理论容量和低化学电位被认为是电化学储能系统的"圣杯",但无规则的锂枝晶生长和与电解液的高反应活性导致其安全性能差和库伦效率低,这严重阻碍了锂金属负极的

期刊

丹宁酸电解液添加剂固态电解质界面膜锂金属负极Tannic acidElectrolyte additiveSolid electrolyte inter

咸水结冰灌溉改良盐碱地的研究进展及展望

冬季咸水结冰灌溉技术是滨海区高矿化度咸水利用和盐碱地改良的有效手段,该项技术依据咸水结冰融化过程中咸淡水分离的基本原理,基于区域气候特点、土壤水盐运移规律以及作物

期刊

盐碱地改良咸水利用咸水结冰灌溉植被恢复盐分淋洗

降钙素原、超敏C-反应蛋白、白细胞计数对新生儿脓毒症早期诊断的临床意义

目的探讨降钙素原(PCT)、超敏C-反应蛋白(hs-CRP)、白细胞计数(WBC)对新生儿脓毒症早期诊断的临床意义。方法选择2018年1月—2019年6月本院收治的88例新生儿脓毒症患儿作为脓

期刊

新生儿脓毒症早期诊断降钙素原超敏C-反应蛋白白细胞计数Neonatal sepsisEarly diagnosisProcalcitoninHyper

系统性红斑狼疮并发IgG4相关性疾病可能一例

IgG4相关性疾病(IgG4-RD)近年来逐渐被认为是一组独立的疾病,可表现为唾液腺、胰腺、肾脏等几乎任何脏器的纤维炎性病灶[1]。系统性红斑狼疮(SLE)同样也是一组多器官受累的自

期刊

淋巴细胞浸润颈部肿物多器官受累自身免疫性疾病炎性病灶治疗反应维普数据库唾液腺

人工智能眼底图像识别与人工识别的一致性分析

目的:探讨在体检机构进行眼底彩色图像人工智能(AI)阅片的可行性。方法:2018年体检中心共完成眼底照相1808例,分别搜集体检眼科医师、三甲医院眼科医师的阅片结果以及AI的阅

期刊

摄片眼底人工智能医师一致性分析PhotographsFundus oculiArtificial intelligencePhysiciansCons

证券市场的功能究竟是啥

提要：伴随着资本市场的成长成熟，公司融资渠道不断拓宽，轻资产高成长的产业模式就和证券金融相得益彰。　　10月7日股市大涨收盘后，国务院发布了《关于进一步提高上市公司质量的意见》。这次发布的文件被市场称为“国七条”，与2004年和2014年两次发布的“国九条”并列，是中国A股市场的重要里程碑。2004年的“国九条”发布后，股市下挫跌破1000点，之后是一轮暴涨暴跌：沪指在2007年10月达到6124

期刊

证券市场轻资产融资渠道暴涨暴跌产业模式股市国九条

前列腺特异抗原及其他肿瘤标志物在前列腺癌早期检测中的应用

前列腺特异抗原(prostate specific antigen, PSA)是1979年由前列腺组织提纯.1980年将PSA作为前列腺癌瘤标应用于临床以来,在前列腺癌的诊断和治疗方面发生了戏剧性的变化,主要体现在以下几个方面:(1)前列腺癌诊断年龄年轻化,年龄<70岁的前列腺癌病人明显增加.(2)早期局限前列腺癌的发现率明显增加.(3)前列腺癌根治手术的比例大幅度提高(2～3倍).(4)前列腺癌

期刊

前列腺癌根治术前列腺特异抗原肿瘤标志物早期检测无转移生存率前列腺组织PSA根治手术根治术后分析结果

经济学视阈下大学生网恋现象分析及其引导

借助经济学的分析方法,从成本—收益角度入手,对高校网恋学生这一主体进行考察,探析网恋在高校中普遍存在的现实性和必然性,并提出网恋的决策模型和正确引导网恋的方案。

期刊

网恋决策模型引导

连续语音识别解码技术的研究

其他学术论文