基于N元文法的领域语法语料扩展算法

被引量 : 0次 | 上传用户：fanxingyi

【摘要】

：

语言模型训练语料的数据稀疏性问题,一直是语音识别任务所面临的一个严重问题。基于领域语法扩展训练语料的方法,能够有效地缓解特定域语言模型训练数据稀疏性问题。本文在领

【作者】

：

梁宏黎塔

【机构】

：

中国科学院声学研究所语言声学与内容理解重点实验室;

【发表日期】

：

2016年期

【关键词】

：

N元文法语言模型语音识别领域语法

【基金项目】

：

国家自然科学基金(批准号:11461141004,61271426,11504406,11590770,11590771,11590772,11590773,11590774);中国科学院战略性先导科技专项(面向感知中国的新一代信息技术研究,编号:XDA06030100,XDA06030500,XDA06040603);国家863计划(编号:2015AA016306);国家973计划(编号:20

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语言模型训练语料的数据稀疏性问题,一直是语音识别任务所面临的一个严重问题。基于领域语法扩展训练语料的方法,能够有效地缓解特定域语言模型训练数据稀疏性问题。本文在领域语法的基础上,提出了一种基于语言模型N元文法(Ngram)的语料扩展算法。该算法通过统计领域语法的Ngram,对Ngram进行扩展,并训练语言模型。实验表明,将该方法应用于特定域语音识别系统中,不仅能提高语音识别系统的识别性能,还能加快语言模型的训练速度,降低语言模型训练对服务器硬盘空间的需求。

其他文献

试论藏族舞蹈在民族民间舞教学中的训练价值

藏族舞蹈作为民族民间舞教学中汉、藏、蒙古、维吾尔、朝鲜五大民族民间舞之一,不论是在中专还是本科的教学里,都是较早推进的一门课程,属于民族民间舞教学的基础内容。本文

期刊

颤膝一顺边自娱宗教

医疗收费何时“日日清”

看不懂的收费单因十二指肠溃疡穿孔而在海南省文昌市人民医院住院的王先生，在办理出院手续时发现：出院当天，他没有接受任何打针治疗，而医院的结帐单上竟然多出了相关的费用。于是

期刊

医疗收费十二指肠溃疡穿孔医院住院出院手续医疗方面文昌市海南省费用

动态处理器

期刊

噪声门限制器压缩器扩展器释放时间压扩器处理器

碳纤维复合材料／铝合金叠层制孔工艺试验研究

对复合材料/铝合金叠层在不同工艺参数下使用不同刀具的制孔工艺进行了研究,探讨了工艺参数对孔径精度、表面粗糙度以及铝合金出口毛刺的影响规律。通过回归分析方法建立了制

期刊

复合材料铝合金叠层制孔三尖钻麻花钻

体外心肌毒性代谢组学样品预处理及UPLC/Q-TOF-MS条件优化

目的筛选最佳的体外原代心肌(PC)细胞代谢组学样品预处理方法,对超高效液相色谱-飞行时间质谱联用技术(UPLC/Q-TOF-MS)的色谱-质谱条件优化,为建立体外心肌毒性代谢组学研究

期刊

体外心肌毒性代谢组学样品预处理超高效液相色谱-飞行时间质谱条件优化

对朱载堉相关研究之回顾与思考——冯文慈访谈择录

这是一篇以访谈形式而呈现的口述资料。通过采访者对中国音乐史学家冯文慈先生的数次采访,梳理了冯先生从事朱载堉及其律学研究三十年的起因、历程、主要事件、成果释读、人

期刊

朱载堉冯文慈新法密率十二等比律律学新说律吕精义

基于仿真模拟的大型体育馆观众层火灾安全疏散设计研究

截止目前,改革开放以来的经济积累为我国文化体育事业的繁荣打下了良好的基础,体育建筑不断向着大型、多元、功能复合的方向发展。体育建筑因其具有特定时间段内汇聚大量人员

学位

大型体育馆火灾模拟疏散模拟疏散口疏散通道坐席布置疏散设计

魔兽世界的爱情 ROMEO&JULIET

“自从联盟和部落并肩作战,共同抵抗燃烧军团的入侵,已经过去了四年。尽管成功地挽救了艾泽拉斯大陆,部落和联盟之间脆弱的协议,却早已荡然无存。如今,震天的战鼓,再一次响起

期刊

魔兽世界ROMEO&JULIET

滋阴活血利咽汤治疗慢性咽炎的临床疗效观察

目的:观察滋阴活血利咽汤治疗慢性咽炎的临床疗效。方法:113例慢性咽炎患者随机分为两组。治疗组56例服用滋阴活血利咽汤;对照组57例服用玄麦甘桔冲剂,疗程均为28天。结果:治

会议

滋阴活血利咽汤慢性咽炎临床疗效观察

去火别犯四种错

<正>随着气温骤升,很多人部感觉上火了。于是,喝凉茶、吃"苦"菜、绿豆汤当水喝……各种去火招数都用上了。可有人发现这"火"还是没下去,有的甚至严重了,这是怎么回事呢?专家

期刊

清热解毒

基于N元文法的领域语法语料扩展算法

其他学术论文