连续语音识别中的循环神经网络语言模型技术研究

来源 :解放军信息工程大学 | 被引量 : 7次 | 上传用户:shengjie139
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言模型是连续语音识别系统的重要组成部分,是语言知识最主要的表示形式,对识别性能的好坏有很大的影响。其中,应用最广泛的是n-gram语言模型。近年来,深度神经网络技术逐渐兴起,并应用于语音识别的各个方面,为语音识别技术带来了新一轮的突破。神经网络语言模型是其中一个重要的研究方向。经过十余年的发展,神经网络语言模型技术取得了丰硕的成果,进入到一个比较成熟的阶段。其中,最具代表性的是循环神经网络语言模型。循环神经网络语言模型具有优越的性能,在语音识别、机器翻译、信息检索等自然语言处理任务中得到广泛的应用,受到了广泛的关注。本文主要对语音识别中的循环神经网络语言模型的解码算法、长距离依赖以及语言模型自适应等问题进行研究,主要的工作如下:针对语音识别中现有的Lattice解码算法难以融合循环神经网络语言模型的问题,提出一种基于N-best的二次解码重打分算法,引入循环神经网络语言模型概率得分,对识别的中间结果进行重打分。并针对识别时测试数据与训练数据不匹配的问题,提出结合缓存循环神经网络模型的方法对解码过程进行优化,提高语言模型在测试数据上词序列概率计算的准确性。实验结果证明,本文提出的方法可以有效提高识别系统在测试集上的性能。提出一种基于上下文词向量特征的循环神经网络语言模型改进方法。对循环神经网络模型结构加以改进,在输入层中增加特征层。在模型训练时,通过特征层加入上下文相关的词向量,获取更多的长距离信息,增强网络对长距离约束的学习能力。有效解决了消失梯度问题所造成的原有模型对长距离约束获取能力不足的问题。通过实验证明本文方法可以有效提高循环神经网络语言模型的性能,降低识别系统的词错误率。最后,针对语言模型对不同语料适应性差的问题,提出一种基于循环神经网络语言模型的自适应方法。由于模型参数的不同,原有n-gram中常用的自适应方法并不适用于神经网络语言模型,因而需要一种新的自适应方法。文中利用自适应数据对通用背景模型的参数进行调整,并提取自适应数据中的主题特征加入循环神经网络语言模型的自适应训练,增强模型对自适应语料的描述能力,提高语言模型在不同语料下的适应性。实验结果表明,本文方法能够改善系统的识别效果。
其他文献
这几年来,建筑行业已经成为促进国民经济发展的支柱性产业,建筑工程的规模以及数量都在不断的增加。而社会的不断进步,也使得很多建筑工程表现出了自己的一些独特特征,会结合
设立村级协检员提高产地检疫率郭旭东孙薇(河北廊坊市畜牧水产局065000)近几年来,固安县马庄镇畜牧兽医站为克服乡镇检疫人员少、区域大、畜禽饲养量多难检疫的困难,探索出了一条建立村
目的:通过肌肉注射异体脂肪间充质干细胞,观察一次性离心运动后,间充质干细胞对大鼠骨骼肌myostatin信号的影响,探讨脂肪源性间充质干细胞在离心运动后骨骼肌修复过程中的作
<正>朗读对于语文学习来说,是一把带领学生走进语文天地的金钥匙,是叩开语文之门的敲门砖。朗读不仅是学习语文的一种方法,也是一门艺术。在朗读过程中,学生的嘴巴、头脑和手
<正> 聚氯乙烯(PVC)用作阻尼材料时多作成与高聚物的共混物,也有采用IPN的方法改善PVC的阻尼性能,前巳报导PVC-丁腈羟低聚物共混物有较佳的阻尼性质。本工作考察了PVC-PIB(聚
结合某地铁区间隧道,研究了运营期地铁盾构隧道管片收敛整治过程中的管片变形特征及其影响。阐述了该区间隧道变形的测量方法与结果。对运营地铁盾构隧道管片收敛整治微扰动
采用自配餐厨垃圾在pH值为6、温度为35℃、TS为100 g/L的条件下进行厌氧消化,并利用其水解产生的酸化液作为外加碳源进行反硝化脱氮试验,考察了水解酸化液、甲醇、乙酸钠等三
<正>持续推进综合化金融服务扶贫模式,既是十九大报告的要求,也是商业银行利用自身经营优势践行企业社会责任的必然,需要政府、企业、商业银行在工作中形成合力,一起攻坚克难