语块识别中英语状语识别结构歧义分析

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:yyj55555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语块识别是机器翻译前期的主要任务之一,其主要难点之一在于句法结构造成许多歧义问题。而状语由于在句子结构中位置灵活,功能多样,通常会在句子结构和语义上产生许多误解和歧义。而近年来,对语块识别领域中结构歧义问题的研究并不多见,而语块识别中针对状语语块识别歧义问题的研究更是少之甚少。状语识别结构歧义的研究对突破状语识别结构研究的瓶颈,从而提高机器识别的质量具有一定的作用。对于造成状语语块识别难度的结构歧义原因有待探究。因此,本文针对机器状语语块分析的结果进行分析,以韩礼德系统功能语法的句法分析为基础,并将机器识别结果同人工识别结果进行比较,旨在探究引起状语语块识别结构歧义的主要原因,从而为减少并消除结构歧义提出建议。在研究过程中,首先,对于机器识别,作者选择了一个自建的商务英语语料库的3000个英文句子作为语料,语料中包含4190个状语语块,进行英语状语语块的自动识别,并对识别错误进行错误分析。结果发现四个类别的状语结构容易引起结构歧义,造成机器识别错误,主要是介词短语、其次名词词组、副词词组以及动词词组。为了进一步说明识别难点以及引起结构歧义的主要原因,从识别结果中挑选20个相对识别难度大的句子给学生进行识别测试并进行错误分析,从而将机器识别结果同人工识别结果进行比较。对于学生识别状语的测试,作者先对学生采取前测保证测试的有效性。继而选择了200个大连理工大学的学生进行状语识别测试,并对学生进行了一个简单的问卷调查,主要是找出学生识别状语的方法。结果表明学生同样也在四类状语结构识别中出现错误,在介词短语的识别中错误率最高,但是却低于机器识别的错误率。而句子结构中状语成分的位置以及句子的复杂程度是引起结构歧义的主要原因,影响机器识别和学生对状语的理解。本文也对机器识别质量的提高以及学生英语语言学习方面给出了启示。
其他文献
内部环境是企业内控控制与管理的框架和平台,在企业内部控制建设与实施过程中它发挥着基础性作用。在现代企业内部控制中如果没有良好的内部环境作支撑,那么内部控制就会形同
总结基于BIM技术和工效数据库,利用线性计划的形式对施工进度进行管理的方法;介绍使用BIM模型构件对应统一作业编码的管理,利用模型工程量和项目进度技术数据库进行计划编排,
近年来,我国对煤炭生产过程中原煤的洗选加工重视程度不断提高,现代化的洗煤厂在各煤炭企业也逐渐得到普及。振动筛是洗煤厂重要的筛分设备,它利用激振器所产生的激励而工作,
目的回顾性分析皖南医学院弋矶山医院临床送检糖尿病足感染病原菌种类与耐药性,为临床经验治疗糖尿病足感染提供依据。方法采用VITEK-2 Compact全自动细菌鉴定仪对2017年1月
当下中国广大乡村社会中,面子文化的盛行、适龄未婚女性的短缺、父母对子女的高度责任感等因素的存在,使得部分地区的彩礼数额已增至几十万元,因婚约解除造成的彩礼返还纠纷也愈演愈烈。目前我国关于彩礼返还的规定较少,并且存在一定的不足,因此对彩礼返还纠纷进行法社会学分析,有利于促进彩礼返还规定的完善,进而可以更好的解决当下存在的彩礼返还纠纷问题。本文从彩礼的含义和特征、彩礼的性质、彩礼返还的基本原则三个方面
烟火药的燃烧属于多组分非均相离散颗粒群的耦合燃烧,且点火燃烧过程是许多吸热、放热化学过程及传热传质物理过程的综合,燃烧特性又最终影响它的输出特性,而烟火药燃烧理论
<正>话题一:加法定义与加法交换律巩子坤:今天我们来聊聊小学中的加法、乘法及其交换律的教与学。小殷,你说什么是加法?殷文娣:我会做加法,但什么是加法、以前怎么学的,早就
胚胎发育是生物学研究中最重要的基本问题之一,所有的多细胞生物都是由一个单细胞——受精卵发育而来。受精卵通过一系列的分裂和分化形成不同形态和功能的细胞,然后进一步构建
【目的】由茄科雷尔氏菌(Ralstonia solanacearum,简称青枯菌)引起的青枯病(bacterial wilt of plants)是世界范围内危害最为严重的土传细菌病害之一,严重制约了多种经济作物的生
过渡金属催化的C-H键活化直接官能化反应研究发展迅速,已成为有机化学领域的研究热点。其中,在导向基策略的辅助下,可以实现取代苯环的邻、间、对位以及取代烷烃的α、β、γ