结合语义向量的双向机器翻译模型及评价

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：luote51499

【摘要】

：

机器翻译的定义是通过计算模型将一种自然语言的书写形式翻译成另一种自然语言的书写形式,近年来由于神经网络计算能力的逐步增强,可以利用神经网络进行机器翻译,词能够被映

【作者】

：

金卓林

【出处】

：

哈尔滨工业大学

【发表日期】

：

2004年期

【关键词】

：

机器翻译深度学习跨语言任务语义向量 LCA

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

机器翻译的定义是通过计算模型将一种自然语言的书写形式翻译成另一种自然语言的书写形式,近年来由于神经网络计算能力的逐步增强,可以利用神经网络进行机器翻译,词能够被映射到维度更高的向量空间中,利用大规模的神经网络将源语言映射到目标语言,神经网络翻译系统在大部分语义上已经超过了传统基于统计的方法。虽然结果有了很大的提高,但整体系统仍受制于训练数据的规模,对平行语料的需求量很大且平行语料标注起来困难较大。因此本文提出的基于语义向量的神经网络机器翻译模型能够利用现有的平行语料,不需要额外其他的平行语料,通过结合资源易获取的数据集构建在目标语言上和源语言上的语义向量,从而提升了机器翻译的性能。另外由于深度学习网络巨大的参数规模,在训练过程中,很多操作和表示都很难解释,也包括在神经网络内部训练中参数动态变化的原因和方式都很难解释。在实验结果分析中,本文利用了一个新的视角去分析训练过程。本文第一部分是构建质量较高的语义向量。本文比较了不同结构对句子进行编码的效果,采用最好的结构对句子进行编码。另外在自然语言理解任务上进行在跨语言的实验,作为语义向量的基线模型,再将编码器的性能通过多任务学习的方式进一步提高,最终得到的跨语言无监督学习得到的语义向量的性能接近有监督学习得到的源语言的语义向量。本文第二部分是利用构建好的语义向量结合到机器翻译模型中,具本文所知这是第一次将由易获取的数据训练后得到语义向量应用到机器翻译任务中。在机器翻译过程中,为了能够充分利用源语言和目标语言在其他易获取的数据上的信息,本文将同时训练双向的机器翻译系统,即同时训练从源语言到目标语言的翻译模型和从目标语言到源语言的翻译。在上述方法的实验结果中可以看到,和其他表现很强的Transformer基线模型相比,在WMT14英法数据集上有了较显著的提高。本文第三部分给出了一种从loss的角度,将loss的变化分配给所有的参数,从而能看出参数对loss减小的贡献起到了正向作用还是反向作用。接下来,利用LCA的方法对上一章的模型进行了检验,通过在标准数据集上的评估,证明力第三章提出的结合语义向量的双向翻译模型新引入的参数,从第三章的实验结果能够提高翻译结果的BLEU值。从本章的角度能够对的loss减小起正向的作用,也就是有助于训练。本文同时比较了几种不同的LCA计算方式,都能得到相同的结论。

其他文献

基于用户画像的不可移动文物个性化推荐系统的研究与开发

在悠久的历史长河中,我国留存下来众多文物古迹,这些文物古迹见证了中华民族波澜壮阔的发展历程,拥有着不可估量的价值。而文物工作的开展不仅有利于继承和弘扬中华民族优秀

学位

用户画像推荐系统个性化推荐不可移动文物

新能源微电网的分层功率平衡协调控制

微电网作为现今分布式新能源发电管理的最有效形式之一,已经受到世界各国的广泛关注和研究。光伏等新能源存在间歇性和不确定性,会对微电网稳定供电、合格供电产生影响。新能源发电通常以电力电子功率器件作为接口并入电网,如何控制这些变换器,实现网内功率平衡,保证电压频率/幅值在规定的范围内,满足用户安全用电需求是一个重要课题。本文研究一种分层控制方案,实现微电网的功率平衡控制,主要包含了以下内容:首先从问题背

学位

微电网分层控制功率平衡储能装置混合式控制

弱随机统计特性点集指纹数据库的快速查找方法研究

随着指纹自动识别技术的广泛应用,对应指纹数据库容量不断增大,如何在大规模指纹数据中快速、准确地进行查找是指纹识别技术的热点问题。本文选取指纹细节点的特征提出了一种

学位

指纹检索弱随机性哈希表核心细节点支持系统

党支部开展党员过“政治生日”的做法与效果

党支部是党的基础组织,应当主动把不忘初心、牢记使命作为加强党的建设的永恒课题和全体党员干部的终身课题,持续加强和改进基层思想政治工作,确保党的每个细胞都始终保持先

期刊

党支部党内政治生活做法与效果

LD端面抽运Tm:LuYAG 2μm固体激光器研究

测风雷达光源的波长要求为2μm左右,Tm:Lu YAG激光器输出的中心波长为2020nm,可以满足其需求,同时和Tm:YAG相比,其输出波长更偏离水的吸收峰,相比于Tm:Lu AG造价更便宜,所以T

学位

连续抽运脉冲抽运Tm:LuYAG声光调Q

毫米波大规模天线系统中低复杂度接收机的研究

随着通信技术的高速发展,在2020年5G商用计划的推动下,人们更加深入地研究5G毫米波通信系统。在毫米波大规模天线系统中,接收机的结构设计和信号处理方法是一项非常关键的研

学位

大规模天线系统毫米波接收机信道估计单用户和多用户系统射频链路

日本江户、明治汉诗坛的清诗受容

本文以和刻本清詩總集為主要研究對象,分為五章論述日本江戶、明治漢詩壇對清詩的接觸、認知、篩選、學習的過程,並著重探討日本在清詩受容過程中的主動選擇與審美特色。第一

学位

清詩和刻本清詩總集日本江戶、明治漢詩壇受容

融合注意力与非局部描述特征的VLAD算法改进

通过对图像进行特征编码获取重要信息是人工智能的一个重要领域,特征编码方法无论在传统图像方法上还是深度学习方法上都是研究学者研究的重点。一种优秀的特征编码方法能够

学位

VLAD注意力特征相关性非局部

基于语义的产品配置需求响应机制研究与实现

随着工业4.0的发展和人工智能等科学技术的兴起,灵活的制造技术和信息技术使人们能够以较低的成本进行产品定制,以客户为中心的新兴生产模式——个性化定制正逐渐取代传统生

学位

大规模个性化定制语义网本体相似度语义推理

基于深度学习的视网膜血管图像分割算法研究

视网膜血管是心血管系统中唯一的可以通过非入侵和非创伤的方式观察到的清晰血管。视网膜血管图像的精确分割对于辅助医生诊断和治疗视网膜病变、高血压等疾病具有重要的临床

学位

深度学习图像分割视网膜血管空洞卷积生成对抗网络

结合语义向量的双向机器翻译模型及评价

其他学术论文