【摘 要】
:
统计机器翻译,又称为数据驱动的机器翻译。该方法由于能够自动从大规模双语数据中学习翻译知识,无需人工干预,且翻译效果优异,成为目前最为主流的机器翻译方法。然而,在实际
论文部分内容阅读
统计机器翻译,又称为数据驱动的机器翻译。该方法由于能够自动从大规模双语数据中学习翻译知识,无需人工干预,且翻译效果优异,成为目前最为主流的机器翻译方法。然而,在实际应用时面临着有些语种之间双语平行语料资源缺乏的问题,为此研究人员提出了基于中间语(轴枢语)的统计机器方法。该方法的核心思想是,利用第三方语种(可多个)作为桥梁,间接地实现源语到目标语的平行关系。这里第三方语种需要满足该语种与源语和目标语之间均存在大量的双语平行数据。一般来说,英语是使用最广泛的中间语媒介。在传统的基于中间语的统计机器翻译中,主要分三种方法:语料级的合成法、句子级的转移法、短语级的融合法。其中,融合法由于高灵活性和优异的翻译性能,成为目前最主流的方法。然而,在传统的融合法中,面临着源语短语信息丢失、生成的短语表中噪声严重等问题。为了缓解上述问题,本文提出了一种基于短语级转移法和融合法的策略,该方法通过质量控制因子的概念,识别在应用融合法时翻译可信度较低的推导,并将这些推导中无法使用的高质量短语重新解码,生成相对高质量的翻译规则,从而达到改善翻译规则、扩大了短语表召回率的目的,进一步提高整体的翻译质量。在以英语为中间语的德-汉翻译任务中,本文使用了近千万的大规模实验数据,验证了文本提出的方法的性能显著优于传统的转移法和融合法,证明了本方法的高有效性。
其他文献
<正>第五届张謇国际学术研讨会在啬翁家乡海门召开,我感到特别高兴。其原因不仅在于自己可以重访张謇故里,更在于这些年海门的张謇研究欣欣向荣,为张謇研究增添了
人类生存离不开水资源。当前,随着经济的发展,水文与水资源存在的问题也逐渐引起大众的关注。我国把水资源的合理利用作为国家规划与发展的重点。由此,本文首先分析水文与水
在中药炮制学实验教学内容中新增多个传统炮制方法及多种典型药材的炮制,使实验教学趋于系统、完整;同时加入了多个现代理化实验,增设综合设计实验,使学生更加深刻地理解中药炮制
政府职能研究在我国理论界是比较热门的话题,因为国家的竞争力与政府提供公共服务能力的强弱有着很密切的关联。但我国一直以来对政府职能的研究都侧重于借鉴国外的公共行政和新公共管理,大多笼统地将政府作为研究对象,很少有学者明确地单独研究乡镇政府职能。2006年国家正式废除农业税,乡镇政府因此面临着更多挑战。也就是从这一年开始,理论界研究乡镇一级政府职能运行及转变的学者就越来越多,逐渐形成了一个相对来说比较
教学质量管理工作是一项极其复杂的系统工程,是学校教学管理的核心,也是独立学院经常性工作的中心。独立学院教学质量的高低,决定着人才培养质量的高低,关乎独立学院的生存与
医疗器械不良事件报告是发现医疗过错中存在的安全隐患、防范医疗事故、提高医疗质量、保障患者安全、促进医学发展和保护患者利益的重要措施。护理人员与医疗器械直接接触,
根据国家电力发展“十三五”规划,到2020年火电占比依然高达60%。由于环境保护问题越来越受到重视,发展高效清洁的火电成为我国电力发展的方向。超临界机组具有无可比拟的经济性,较传统机组热效率高,煤耗低,氮氧化物排放少,脱硫率高。在环境日益恶化,资源越来越少的背景下,超临界机组的优势巨大。虽然超临界机组在提高热效率和减少污染物排放方面的优势巨大,但是由于其采用的容量较大、参数较高,这直接导致锅炉水冷
袖子作为服装的一个基本组成部分,肩袖部位的造型设计是构成服装款式的重要组成部分,对服装的整体造型和风格具有直接影响力,不同的肩袖造型设计对服装整体效果会产生不同的影响。落肩袖在人类服装发展史上经历了漫长的演变,贯穿东西方整个服饰发展历程,其不断被翻新的艺术效果促使其成为时尚服装的经典袖型,近几年占据着时尚舞台中重要的位置。落肩袖的概念和结构设计在研究领域一直较为模糊,与造型设计存在不对等的关系,因
情绪与情感是一对既相连又不同的人类心理因素,直接影响到各个器官、感官能否正确、协调、统一地运动和发挥功能。因此在演唱时要求情绪和情感要与演唱的曲目相符,使发声器官
物流责任保险几乎涵盖了物流行业的所有运营风险:运输,配送,装卸,仓储,包装,配送加工和信息服务。它为物流公司提供供应链中的物流链接,为物流企业设计合理的保险产品是物流