融合日语格语法的层次短语统计机器翻译研究

被引量 : 1次 | 上传用户:ssoqyhm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器翻译是利用计算机实现不同语言间翻译的一门科研型和应用型的学科。随着科技的发展,现在社会信息量膨胀。机器翻译在旅游会话、产品全球化和信息检索等领域的需求量越来越多。近几年,机器翻译研究取得了很大的进展。但是,在具体应用中,机器翻译还未达到令人满意的水平。在统计机器翻译中,如何有效利用语言学知识仍然是机器翻译中的一个研究热点。在市场应用中,统计机器翻译方法仍然占据主导地位。所使用的模型主要有短语模型和层次短语模型。由于涉及到句法结构的翻译模型比较复杂,因此其往往很难投入到产品中。然而,随着计算能力的提高,融合语言学和句法知识的翻译模型潜力巨大。因此,如何使用句法知识和语言学知识提高传统模型成为了主要问题。格语法是语言学中成熟的语法理论。在众多语言中,日语格是一种显性格,格信息由不同的格助词标记。因此,日语的格框架较其他语言更加明显且容易分析。此外,日语格框架已被使用于日语句法分析,较其他任何语言,日语句法分析得到了最好的效果。因此,本文提出将日语格框架应用于层次短语模型中。这是在统计机器翻译中的首次尝试。本文的贡献可分为以下几点:(1)利用日语格框架约束层次短语翻译规则,从语义学的角度阐述层次短语规则的生成,使其更加合理。目的在于更加有效地利用统计学与语言学之间的关系。实验表明层次短语规则数量减少。(2)提取日语格框架调序规则,并将其用于翻译过程。目的在于缓解层次短语在长距离调序中,glue规则的频繁使用。并且,本文考虑词对齐的错误带来的影响,在规则抽取过程做了软约束。实验表明提高了翻译质量。(3)提出基于chunk的依存树到串的上层翻译过程,使翻译过程更加符合规则的描述。目的在于缓解虚词和助词在词对齐上的影响。通过实验分析,本文证明了提出方法的合理性及有效性。
其他文献
渤南洼陷深层烃源岩主要为古近系沙河街组四段暗色泥岩、砂泥岩及膏盐层,有机碳含量为0.9%~2.39%,干酪根为Ⅰ和Ⅱ1型;深部储集层以沙河街组四段砂砾岩、细砂岩及泥灰岩为主,
中小企业是促进江苏省经济发展的重要力量。近年来,受国内外经济环境的影响,中小企业的发展遇到了诸多难题,为了促进中小企业的健康发展,我们对江苏省内具有代表性的企业开展
公司解散纠纷近年来迅速增多,也存在很多问题亟待解决。以上海法院近5年公司解散案件的实证分析为基础,从具体案例和统计数据入手,可以发现审判实践中公司解散纠纷在"严重困
清泉寺作为南充市近郊主要的宗教园林,在宗教文化旅游方面发挥着重要作用。文章通过实地调查,对清泉寺的寺庙选址、建筑布局及植物造景等方面进行论述,可为当代寺庙园林建造
关于教师专业发展,主要研究内容包括两个部分,其一是教师专业成长过程,其二是教师教育,即促进教师专业化成长的过程。对于教师的专业化发展,可以从教师的专业结构进行分析,也可针对
本文提出了一种新型智能移动相变蓄热供热方法,选取具有强大蓄热潜热的低温相变蓄热材料作为储能介质,对城市间断、分散的余热、废热进行最大限度的回收利用,并实现蓄热装置
长庆石化公司60万t/a连续重整装置开工初期重整进料热交换器E201精制油相进料分布器即发生堵塞,介绍了采用在线短时间内切除进料进行反冲洗的处理过程,总结了处理过程中的优
生物催化在工业催化过程中发挥着重要的作用,而生物催化剂的固定化在其应用中扮演着重要角色。仿生黏附材料是基于海洋贻贝粘蛋白研究基础上人工合成的一种在水中具有粘附功
高岭土经氢氧化钠活化后与盐酸反应制备了硅铝酸盐凝胶,所得硅铝酸盐凝胶经过干燥与酸化处理得到氧化硅。利用红外光谱(IR)、X射线衍射(XRD)和X荧光光谱(XRF)对所得硅铝酸盐
新奢侈主义已经日益成为一种时尚、一种现象,而其代表的品牌价值通常传达给世人的是它对世界的理解以及它所信奉和倡导的价值观“奢侈其实是一种生活态度。”这是美国哥伦比