基于N元文法的领域语法语料扩展算法

被引量 : 0次 | 上传用户:fanxingyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言模型训练语料的数据稀疏性问题,一直是语音识别任务所面临的一个严重问题。基于领域语法扩展训练语料的方法,能够有效地缓解特定域语言模型训练数据稀疏性问题。本文在领域语法的基础上,提出了一种基于语言模型N元文法(Ngram)的语料扩展算法。该算法通过统计领域语法的Ngram,对Ngram进行扩展,并训练语言模型。实验表明,将该方法应用于特定域语音识别系统中,不仅能提高语音识别系统的识别性能,还能加快语言模型的训练速度,降低语言模型训练对服务器硬盘空间的需求。
其他文献
藏族舞蹈作为民族民间舞教学中汉、藏、蒙古、维吾尔、朝鲜五大民族民间舞之一,不论是在中专还是本科的教学里,都是较早推进的一门课程,属于民族民间舞教学的基础内容。本文
看不懂的收费单因十二指肠溃疡穿孔而在海南省文昌市人民医院住院的王先生,在办理出院手续时发现:出院当天,他没有接受任何打针治疗,而医院的结帐单上竟然多出了相关的费用。于是
对复合材料/铝合金叠层在不同工艺参数下使用不同刀具的制孔工艺进行了研究,探讨了工艺参数对孔径精度、表面粗糙度以及铝合金出口毛刺的影响规律。通过回归分析方法建立了制
目的筛选最佳的体外原代心肌(PC)细胞代谢组学样品预处理方法,对超高效液相色谱-飞行时间质谱联用技术(UPLC/Q-TOF-MS)的色谱-质谱条件优化,为建立体外心肌毒性代谢组学研究
这是一篇以访谈形式而呈现的口述资料。通过采访者对中国音乐史学家冯文慈先生的数次采访,梳理了冯先生从事朱载堉及其律学研究三十年的起因、历程、主要事件、成果释读、人
截止目前,改革开放以来的经济积累为我国文化体育事业的繁荣打下了良好的基础,体育建筑不断向着大型、多元、功能复合的方向发展。体育建筑因其具有特定时间段内汇聚大量人员
“自从联盟和部落并肩作战,共同抵抗燃烧军团的入侵,已经过去了四年。尽管成功地挽救了艾泽拉斯大陆,部落和联盟之间脆弱的协议,却早已荡然无存。如今,震天的战鼓,再一次响起
目的:观察滋阴活血利咽汤治疗慢性咽炎的临床疗效。方法:113例慢性咽炎患者随机分为两组。治疗组56例服用滋阴活血利咽汤;对照组57例服用玄麦甘桔冲剂,疗程均为28天。结果:治
<正>随着气温骤升,很多人部感觉上火了。于是,喝凉茶、吃"苦"菜、绿豆汤当水喝……各种去火招数都用上了。可有人发现这"火"还是没下去,有的甚至严重了,这是怎么回事呢?专家
期刊