多语种同义词组的自动建立研究

被引量 : 0次 | 上传用户:kelukeke
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多语言词典在机器翻译和自然语言处理等计算机研究领域有着非常重要的作用。经过研究人员多年的努力,多语言词典方面的研究取得了很多的成就,但是到现在为止,仍然没有一种多语言词典可以涵盖到所有的自然语言。在这篇文章中,我们提出了三种新颖的计算机多语言词典的自动建立算法:三元组合自底向上的层次化扩展方法,三元组合并全覆盖扩展方法和三元组合并双覆盖扩展方法。这些算法利用已存在的三语言同义词组的自动建立算法,将多个三语言同义词组按照一些规则相互合并得到多语言的同义词组。这些算法解决了计算机词典自动建立过程中的“错误累积问题”。在实验中我们使用这些算法得到了中文,英语,德语和日语四国语言的词典,并对结果进行了分析和比较,评测结果表明我们得到的多语言词典具有很高的精确度。在文章的最后我们以语言网络提供的网络服务为基础,建立了一个多元组协调的多跳机器翻译系统。该系统利用多语言词典来替换多跳机器翻译过程中误译的部分,使得多跳机器翻译的中间结果之间能够保持词语概念的一致性。对该系统的质量评测表明我们解决了多跳机器翻译系统中词的“概念迁移”问题,并最终实现了多跳机器翻译系统的优化。
其他文献
隧道工程中地下水作用在衬砌上的外水压力是进行衬砌设计的一个重要因素,如何确定外水压力是隧道工程界迫切需要解决的一个问题.以往的相关研究可大致分为折减系数法、理论解
了解年老过程中大脑在细胞水平上发生的变化对于揭示老年人认知功能下降的原因有重要意义。扩散MRI(diffusion MRI,d MRI)技术是目前惟一可以无创探查活体组织微观结构的方法。
当前,全国大额现金交易监测试点工作已经期满半年多,客观上需要对监测试点进行总结分析,本文以昆明地区的试点监测为依据,分析我国大额现金交易试点监测制度,结合深圳等地的
信息几何是在Riemann流形上采用现代微分几何方法来研究统计学问题的基础性、前沿性学科,被誉为是继Shannon开辟现代信息理论之后的又一新的理论变革,在信息科学与系统理论研
针对某烟草机械用齿轮齿条式分度凸轮机构,通过解析法建立了共轭凸轮廓线方程,利用Catia建立了齿轮齿条式分度凸轮机构虚拟样机,基于多体动力学软件Recurdyn建立了该机构运动
作为钢琴教学中备受关注的内容之一,内心听觉是一种经过长期训练且不依靠人声及乐器而获得的音乐素养。学生内心听觉能力的提高有利于钢琴演奏水平的进步。本文首先简要分析
混声无伴奏合唱《天琴女》是广西艺术学院吴远雄教授的新作,此作品于"2014中国——东盟音乐周"专场音乐会上进行首演。《天琴女》是一部具有浓郁壮族音乐风格的混声无伴奏合
<正> 敦煌遗书针灸文献的内容,虽说已大半残缺不全,但是作为针灸医学的宝贵遗产,它在发掘和研究中华医学史上仍不失其重要的意义。敦煌针灸遗书的发现大大地丰富了唐代的医籍
本文是在安徽省合肥市对劳动者、用人单位和仲裁员所作调查基础上,对劳动争议仲裁调解状况的调研报告。调研结果显示,劳动争议仲裁调解促进了劳动争议的解决,对劳动关系的和
目的探讨剖宫产后再次妊娠分娩方式母婴结局。方法对延安大学附属医院2009年2月至2012年2月期间诊治的218例剖宫产后再次妊娠孕妇临床资料进行回顾性分析。结果 218例孕妇中