层次化蒙古语语言模型的构建研究

来源 :内蒙古大学 | 被引量 : 6次 | 上传用户:shiwuxin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言模型是描述自然语言内在规律的数学模型,它广泛地应用于机器翻译、语音识别和文本校对等领域。近几年,基于语料库的统计语言模型的构造技术成为新的研究热点,统计语言模型也已逐渐成为自然语言处理的主流技术之一。我国蒙古语语言模型技术还缺少很多相关的研究,这也间接影响少数民族地区信息化建设的进程。本文对统计语言模型的相关技术进行了探讨,并对蒙古语的特点进行了分析。根据蒙古语典型的构形词缀的特点,通过深入挖掘蒙古语词干和词缀之间的依赖关系来提高语言模型对蒙古语描述的准确性。具体方法是将蒙古语语言模型分为三个层次,分别是词干和词干的依赖、词干和词缀的依赖、词缀和词缀的依赖。在这三个层次上分别构造合适的语言模型,然后再把它们结合起来成为一个完整的适合于蒙古语的语言模型。本文最后把这种层次化的蒙古语语言模型方案应用到了一个基于实例的汉蒙机器翻译系统中,实验证明本文所构造的层次化的蒙古语语言模型能够有效地提高汉蒙机器翻译的效果。
其他文献
随着网络技术的发展,各种即时通信产品层出不穷,目前最常见的几种即时通信软件有QQ、MSN、yahoo messenger。由于它们的协议不是公开的,因此易形成信息孤岛。Jabber的提出打
水泥行业作为国民经济支柱产业之一,在我国国民经济中占据重要地位。2007年我国水泥产量为13.5亿吨。山东省一直是水泥生产大省,已连续多年稳居全国水泥产量第一的位置,2006年的
随着网络技术的飞速发展,分布式资源的应用与管理对网络性能提出更高的要求。在此背景下,微软在windows server 2000中引入活动目录技术,之后又在windows 2003中改进了活动目
学位
Web使用挖掘是Web数据挖掘研究领域的重要应用研究方向之一。其旨在通过对Web日志进行有效的数据挖掘,发掘隐藏在日志数据背后的规律和用户访问模式,从而改进Web站点设计,向
无线传感器网络是一种用于监测指定区域环境信息的自组织网络,它通过在目标区域内抛撒大量的嵌有传感器的节点进行组网。由于传感器节点电量容量有限,因此随着网络的长时间不
决策支持系统(Decision Support System,DSS)是一种帮助中高层管理人员进行决策的计算机系统,这种系统综合运用了信息论、人工智能、信息经济学、管理科学、行为科学等学科的
随着计算机应用领域的扩大,软件规模及复杂性不断提高,提高软件生产率是当前软件产业的当务之急。为解决这个问题,软件复用是有效的办法。领域工程为软件复用提供了有力的技术支
三维地形可视化在地理信息系统、实时仿真及3D游戏等领域都占有非常重要的地位。随着遥感技术、卫星技术的发展,三维地形场景的几何数据和纹理数据量日益庞大。因此,为了实现大
在现代信息社会中,每个行业都在不间断的产生海量的新数据。这些数据支撑行业的发展,也是科技创新的一个重要来源。大数据领域的基石就是存储、管理和分析数据的数据中心。无