基于参考译文图的机器翻译质量评价方法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:kenshin578212121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技日新月异的发展,机器翻译技术得到了越来越多人的关注,其理论研究以及实际应用都已成为机器学习领域的一大热点。与人工翻译相比,机器翻译在翻译效率上有较明显的提高,且代价较低,所以自动化翻译技术(机器翻译技术)的研究已经成为一个非常重要的研究方向。随着机器翻译技术的飞速发展,机器翻译质量评价这一研究课题应运而生,对于机器翻译系统产生的翻译结果,我们需要衡量其翻译质量如何。完成机器翻译本身并不是最终目的,我们希望知道机器译文能够在多大程度上帮助到人们,同时,对机器译文质量有大致的评估,也有助于学习得到一个更好的机器翻译系统,这两者相辅相成。对于机器译文的评测,传统的方式是进行人工评价,但是这种方式由于其耗时、代价昂贵且结果不可重现,现已被自动评测方法部分取代。当前主流的自动评测方法,采用的都是相同的策略:将机器译文与一个或是多个人工译文(参考译文)进行比较,并且认为一个与参考译文非常相似的机器译文肯定比那些与参考译文有较大差异的译文更准确。但是,由于语义和表达方式的多样性,源语言中的一个句子可能有很多不同的正确翻译结果(即翻译多样性),而参考译文是有限的,这就会导致在一些情况下,自动评测方法不能准确的对译文质量有一个评估,同时这一问题也限制了机器翻译系统的翻译能力。在本文中,我们针对目前的自动评测方法在翻译多样性方面的的缺陷做出了改进。由于人工翻译的昂贵代价,我们能够获取到的参考译文是有限的,因此,本文提出了一种从有限的资源中获取到更多信息的自动方法。首先,我们探索了不同的评价方法以及选择不同的参考译文对机器翻译系统的影响;其次,对已有的参考译文进行拓展,对于部分存在多个参考译文的数据集,通过构建一个参考译文图以获取更多的信息,对于大部分只存在一个参考译文的数据集,利用外部单语资源英文复述表,对当前的参考译文进行拓展,得到一个含有更加丰富信息的参考译文图;最后,通过从参考译文图中寻找最优路径以提高效率,并将该自动方法应用到已有的自动评测方法中,帮助提升机器翻译系统本身的翻译能力。实验结果表明,本文提出的从有限的资源中获取到更多信息的自动方法能够更快地获取到更加丰富且多样的参考译文信息。对于多个参考译文的拓展,能够对机器译文作出更加准确的评价;对于单个参考译文的拓展,不仅能够更准确地评价系统译文,同时还减小了使用不同译文带来的系统性能的差异;将该方法应用于翻译系统的训练过程,有效的提高了翻译系统能力。
其他文献
随着锡林郭勒草原煤矿的不断开采,草原上堆集了大量的地表剥离物,形成了众多排土场。堆土直接破坏了草原植被,破坏了草原景观的完整,剥离物在风的作用下形成沙尘,未经过处理的排土
作为补语的一个重要类型,趋向补语突出反映了汉语的特点,其他语言中很少有与之对应的语言现象。汉语的趋向补语意义复杂、用法灵活,再加上汉语与其他语言的这一语法点的对应
近年来,随着中国经济的快速发展以及国际地位的不断提高,汉语学习者越来越多,一度形成汉语学习的热潮。韩国的高中教育紧跟时代步伐,汉语日渐成为韩国高中生第二外语选修的首
介绍了采用AOTF技术的红外光谱仪的总体结构。讨论了单色系统和光谱接收系统的光学设计问题,以及单片机控制下的DDS频率 波长扫描电路和光谱信号相关检测电路。概述了PC机控
腰椎病是指因脊柱及脊柱周围软组织急慢性损伤或腰椎间盘退变、腰椎骨质增生等原因引起,在临床上表现为以腰痛、腰部活动受限和腰腿痛为主要症状的疾病。医学上所讲的腰椎病,
中职电子类专业网络课程开发及应用研究,是基于推进中等职业教育信息化,职校生课内外及终身学习和师生教与学方式改变的需要背景下提出的,具有一定的研究价值和实践意义。近
<正> 《左传》“君子曰”是表示对某一事件或人物的评论,但全书属于“君子曰”这样的称谓有几种。 (一) 在《左传》中,“君子曰”共四十八见,如首例隐公元年“君子曰”: 颖考
指示语是语用学研究中的一个重要课题。指示语与语境密切相关,具有先用权性质与反先用权性质。说话者的心理趋势体现在指示语的使用中。指示语的使用可以分为先用与反先用:先
本文以韩国教育厅选定的十一本教材之一的《生活中国语》为研究对象,研究教材中出现的文化因素。本文研究内容主要有:第一章为绪论,介绍文章的选题背景和意义、研究内容、研
关于怎样进一步落实“请进来”与“走出去”发展思路的问题 ,文章认为 ,进一步搞好制度创新 ,加快建好微观经济基础 ,提高“请进来”与“走出去”的质量 ,建好社会保障体系是