长距离语言模型及其应用研究

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户：songzilang

【摘要】

：

语音识别是非常重要的人机交互技术,但是在常用的语音识别系统中采用的都是低阶的N-gram语言模型,它注重邻近约束而忽略了句子中的长距离依存关系,因此,将长距离信息结合到语

【作者】

：

任伟

【出处】

：

北京邮电大学

【发表日期】

：

2017年01期

【关键词】

：

依存句法分析长距离语言模型语音识别后处理

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音识别是非常重要的人机交互技术,但是在常用的语音识别系统中采用的都是低阶的N-gram语言模型,它注重邻近约束而忽略了句子中的长距离依存关系,因此,将长距离信息结合到语音识别的过程中去,可以融合更多的词语搭配信息,进一步提升语音识别的性能。本文基于依存句法分析进行了长距离依存关系的挖掘以及建模,并且结合其特性将其合理应用到语音识别的后处理中,主要研究工作包括:1、基于依存词对的长距离语言模型的建模。采用依存句法分析得到了具有长距离依存关系的词对,并通过实验确定了其最优的词对关联度指标;提出了将基于依存词对的长距离语言模型与其他语言模型相结合的加权融合算法,有效提升了其他语言模型的建模能力,使其更准确地反映词对间存在搭配关系的概率。2、依存句法分析在语音识别后处理中的应用。将基于依存词对的长距离语言模型与其他高级语言模型进行加权融合,应用于Lattice的前向重打分;建立了基于词对依存关系下词性搭配的模型,加权联合前面生成的基于依存词对的长距离语言模型作为N-best候选句子的置信度得分标准,在重打分的过程中有效结合高级的语法知识,在一遍解码的基础上进一步提升了语音识别的识别率。实验表明,采用加权融合的基于依存词对的长距离语言模型在测试集上的复杂度降低了 19.93%,在Lattice的N-best候选上采用基于依存词对的长距离语言模型和基于词对依存关系下词性搭配的模型的加权联合方法,使得语音识别系统的词错误率下降了 5.69%。

其他文献

家政服务消费发展情况

<正>在促进家政服务消费方面,国家出台了实施家政服务提质扩容行动,开展员工制家政服务免征增值税的政策试点,实施家政服务劳务对接扶贫行动,开展家庭服务业规范化职业化建设

期刊

家政服务职业化建设员工制

技术标准体系与市场准入基础知识(3)

本讲座分3部分刊出。第三部分介绍我国铁路标准体系概况,我国铁道行业标准体系及其管理体制;我国铁路市场准入概述、种类,技术机构对铁路产品市场准入制度的支撑,铁路市场准

期刊

技术标准体系市场准入基础知识

日粮营养补添与粗饲料利用

粗饲料的营养价值较低。通过适宜的日粮营养补添调控反刍动物瘤胃微生物区系的生长可提高粗饲料的利用效率。日粮营养补添包括 :改善日粮精粗比以增加能量供给 ;供给瘤胃氨态

期刊

畜牧学粗饲料综述反刍动物日粮营养补添

脂蛋白替代鱼粉等优质蛋白对哺乳和断奶仔猪生产性能的影响

研究对羽毛、皮革和血粉等消化率低的蛋白质饲料进行酸水解和蛋白酶降解处理,并与脂肪酸结合形成利用率较高的高能和高蛋白质的脂蛋白饲料。通过哺乳和断奶仔猪的饲养探索用

期刊

生产性能脂蛋白仔猪

大学生骨干理论素质培养探析

大学生骨干作为大学生中的一个特殊群体,是高校、教师和学生之间紧密联接和有效沟通的桥梁和纽带,也是高校思想政治教育工作展开的重要环节。高校必须针对学生的思想特点,从

期刊

大学生骨干理论素质培养途径

狗肉风波背后的刻板印象

最近，在墨美边境城市的蒂华纳，一家中国餐馆的发布会，吸引了19家平面媒体，7家电视台和4家电台。$$ 故事很简单：顾客发现这家餐馆在烹制狗肉，随即报警，于是当局查封了餐馆。尽管当

报纸

究竟怎样认识人道主义及其在我国道德教育中的地位——《马克思主义与现实》两篇文章读后

<正> 70年代末80年代初我国开展的那场人道主义争论,其影响是深远的。这场争论的成果之一,是认为人道主义伦理原则可以经过扬弃而纳入社会主义人道主义体系之中。但在那场争

期刊

人文主义伦理原则历史观平等待人集体主义爱国主义《马克思主义与现实》人道主义原则马克思主义与现实

吉勒布拉克堆石坝施工期内部沉降分析

混凝土面板堆石坝施工期的内部沉降观测可通过水管式沉降仪来实现,实时观测数据可用来指导大坝的施工进度和质量控制。以新疆吉勒布拉克水电站混凝土面板拦河大坝为例,介绍水

期刊

混凝土面板堆石坝施工期内部沉降水管式沉降仪沉降规律

长距离语言模型及其应用研究

其他学术论文