论文部分内容阅读
近几年深度学习在机器翻译上的应用已经获得人们的关注并取得与统计机器翻译可比甚至更好的成果。传统的机器翻译在深度学习上的应用都是用两种语言的平行语料来训练的,有时我们可以获得大量的三种或者多种语言的平行语料,可以同时训练两个或多个端到端的翻译系统,输入端是不同语种的平行语料,输出端是同一目标语料。由于不同的输入端是表示同一含义的不同语种的表达形式,本文猜测不同输入端编码得到的中间向量具有某种联系。本课题通过探索不同语种向量表示间的联系来达到提升机器翻译性能的目的。在本文的研究中,涉及三种平行语料,本文将其中两种平行语料作为源语言,剩余一种作为目标语言。本文的研究包含以下几个方面。(1)对比分析不同语种的平行源语言到同一目标语言在相同方法下的翻译性能。本文用同一个基于深度学习的机器翻译方法(NMT)训练了两个端到端的翻译系统,分别是中文到日文的翻译系统和英文到日文的翻译系统,综合考虑实验结果和NMT的原理,本文得出基于三语平行语料的语义向量的机器翻译研究的必要性。(2)基于向量拼接的机器翻译研究及其扩展研究。本文将分为三部分介绍。第一部分的研究中,本文得到一个新的语义表示向量,这个向量包含了来自两种源语言的中间向量,本文认为这个向量同时包含了两种源语言的信息,本文用这个新的向量来生成输出变量序列,即目标语言。但是在这个方法中,其中一种源语言到目标语言的翻译系统和另一种源语言到目标语言的翻译系统的参数不独立,因此在训练过程和测试过程中我们都需要输入两种平行的源语言才能完成。第二部分的研究中,希望通过中轴语翻译的方法,在系统参数独立的情况下,借助翻译性能较好的翻译系统来帮助提升翻译性能差的系统。第三部分的研究中把前两部分的研究内容相结合,本文仍然得到同时包含两种源语言信息的语义向量,但将基于向量拼接的机器翻译研究中的模型和中轴语翻译方法结合,使得在测试过程中只输入单语,本文仍然希望借助翻译性能好的翻译系统来提升翻译系统较差的翻译系统的性能。(3)基于向量相似的机器翻译研究。在该研究中,协同训练两个不同源语言到同一目标语言的翻译系统,由于两个翻译系统中源语言是平行语料,代表同一句话的语义,本文猜测这两种平行语料的中间向量具有一定的相似性,基于此,本文在协同训练过程中加入了约束条件,让输入端源语言的语义向量的距离接近,达到优化翻译系统的目的。在该研究中,两个系统的参数相互影响但独立,即模型一旦被训练好,在测试过程中只需要输入单语即可完成对应的测试。