论文部分内容阅读
在如今经济全球化的时代,翻译服务的重要性逐渐体现。相较于人工翻译服务而言,机器翻译的速度更快,更能满足社会的需求。神经机器翻译作为一种利用大规模双语平行语料对神经网络进行训练,从而得到翻译模型的技术,已经成为机器翻译的主流方法,被广泛用于各种语言之间的翻译工作当中。本文以中英神经机器翻译为例,对神经机器翻译的关键技术进行了研究与应用。神经机器翻译通常仅通过平行语料学习翻译知识而忽略了语言本身的先验特征。除此之外,在主流的神经机器翻译模型中,只有最顶层编码器的输出得到了利用,其他的深层信息则被忽略,这也限制了翻译模型的性能。本文为解决以上问题,完成了以下工作:(1)提出了融入多粒度形态特征的中英神经机器翻译模型。中文词语由汉字组成,而汉字能够进一步划分为部件,这些组件的形态特征与词语的语义有着极为密切的联系。本文创新性地提出的基于部件n元组的中文词向量模型能够获取细粒度的形态特征。而粗粒度特征则通过BERT预训练语言模型的词嵌入层获得。在中英神经机器翻译任务中,本文的翻译模型相较于基准模型Transformer提高了0.78的BLEU-4评分。本文提出的中文词向量模型在词向量评测任务中分别取得了88.8与63的最高分,验证了模型提取中文形态特征的能力。(2)提出了基于深层编码器信息的神经机器翻译模型。为了解决在深层翻译模型中解码器仅对最顶层的编码器输出进行解码的问题,本文设计了三种方法使得深层编码器的输出信息也能被模型充分利用,分别为:平行层编码器信息的引入,多层编码器信息的引入,动态深层编码器信息的引入。本文根据三种方法分别训练得到三种基于深层编码器信息的翻译模型,并与基准模型Transformer在中英神经机器翻译任务上进行对比。实验结果表明,本文提出的模型最高比基准模型提高了0.89的BLEU-4评分,验证了本文方法的有效性。(3)基于本文创新点改进的神经机器翻译模型,设计并实现了一个神经机器翻译WEB系统。该系统基于B/S架构,实现了用户交互层,核心服务层及模型处理层,系统的用户界面简洁易用,能够提供准确的机器翻译服务。