【摘 要】
:
中国由56个民族组成,各民族文化差异巨大,经济发展情况不一。为了实现中华民族伟大复兴的“中国梦”,各民族间经济文化的交流必不可少。然而,各民族语言的差异成为了主要障碍。语言翻译是克服这一障碍的主要途径。由于专业人工翻译难以满足人们的翻译需求,机器翻译成为了克服这一障碍的重要手段。维语作为维族人民的民族语言,具有少数民族语言平行语料少、语法结构复杂等特点,可以作为研究少数民族语言和汉语翻译之间的切入
论文部分内容阅读
中国由56个民族组成,各民族文化差异巨大,经济发展情况不一。为了实现中华民族伟大复兴的“中国梦”,各民族间经济文化的交流必不可少。然而,各民族语言的差异成为了主要障碍。语言翻译是克服这一障碍的主要途径。由于专业人工翻译难以满足人们的翻译需求,机器翻译成为了克服这一障碍的重要手段。维语作为维族人民的民族语言,具有少数民族语言平行语料少、语法结构复杂等特点,可以作为研究少数民族语言和汉语翻译之间的切入点,为以后少数民族语言的翻译提供更多的思路和方法。目前,大多数维汉翻译的研究成果都是基于传统的统计机器翻译模型,利用小规模平行语料训练完成的。这些研究大都遵循了较为传统的统计机器学习思路,并取得了一定的成果。但是,有关维汉神经机器翻译的研究仍然处于探索阶段。本文的研究针对维汉翻译的特点,采用不同于统计机器翻译的思路和方法,基于神经机器翻译的技术路线,完成了以下工作:(1)学习了神经机器翻译理论及相关技术。本文首先对神经机器翻译相关概念进行了阐述,然后介绍了各种模型及技术手段,接着详细描述了机器翻译自动评测方法及工具。(2)提出了基于Self-Attention的语言模型以及基于双编码器双解码器的翻译模型。为了解决平行语料不足的问题,本文采用基于Self-Attention的语言模型来充分利用单语语料提升翻译效果。另外,为了充分提取维汉两种语言的特征,本文提出了基于双编码器双解码器结构的翻译模型,并且给出了结合回译过程的训练算法。最终完成维汉翻译任务。(3)对比分析了各模型在维汉翻译任务上的效果。在拥有小规模维汉平行语料库和维汉单语语料库的前提下,对比实验了基于短语的统计机器翻译、有监督学习的神经机器翻译、无监督学习的神经机器翻译以及半监督学习的神经机器翻译,并对结果进行了分析。最后,基于以上创新点和其他相关研究工作,本文实现了一个基于B/S架构的维汉神经机器翻译系统。实验结果表明采用本文的模型及算法可以有效提升维汉翻译效果。
其他文献
目的:观察食疗方法对2型糖尿病的防治作用。方法:禀承《内经》“除陈气”的治疗大法,以《内经》提倡的“调食和药”,即食疗方法用于不同体质2型糖尿病病人,进行疗效观察。结果:对FP
目前,我国对ABS的需求将以年均4%的速度增长,到2020年国内ABS的需求量将达到600万t。随着国内ABS树脂产能的大幅度增长及技术水平的不断提高,未来几年ABS树脂进口量会逐渐减
在输电线路防雷性能的研究中,绝缘子闪络判据直接决定了计算线路耐雷水平的准确性。为此根据长空气间隙的物理放电机理,并综合绝缘子串的结构特点,建立了基于连续先导发展的
目的探讨Ki-67蛋白以及p16蛋白在宫颈上皮内瘤变中的检测意义。方法选取2017年1月至2019年1月在我院就诊的54例宫颈上皮内瘤变患者,将其根据CIN等级分成CINⅠ组(n=24例),CIN
服务的本质是提供顾客体验。服务体验是由顾客与服务企业"共同创造"的。服务体验的"共同创造"有一个复杂的内部机制。首先,服务体验的"共同创造"是在企业及其网络与顾客及其
目的了解新疆维吾尔自治区乌鲁木齐市某社区维吾尔族和汉族育龄期妇女碘营养水平及其差异。方法选取2013年5月在乌鲁木齐某社区进行甲状腺疾病流行病学调查的2 080例受试者中
本文以实际工程为研究背景,根据模型相似关系,通过拟动力试验的方法,对钢筋混凝土框架-剪力墙模型结构的滞回反应和耗能进行了分析,探讨了结构在地震作用下的破坏机理及其薄
1974年,在给《哎咿!》一书所做的序中,华裔美国作家赵健秀(Frank Chin)和志同道合的其他华裔美国作家陈耀光(Jeffery PaulCha)、稻田(Lawson Fusao Inada)、徐忠雄(Shawn Wong)一起对英
随着近些年我国经济的飞速发展,共享经济越来越来被大家所认可也有了更多的发展和扩张的空间,然而,在我国共享经济领域对共享的实体经济还是无法摆脱与出行相关的交通工具一
通过对煤炭开采引起覆岩变形破坏的研究,进行理论分析及数学推导,对晋城矿区寺河矿采空区煤层气资源进行计算。采空区内煤层气资源主要由吸附气及游离气构成,基于煤层开采后