论文部分内容阅读
英语介词的数量不多,但其构成的介词短语在英语中的出现频率很高,功能多样且位置灵活,易引起句子歧义。英语介词短语句法功能识别是浅层句法分析的前提,对提高翻译质量具有重要的作用。本文以系统功能语法为指导,研究商务领域中面向机器翻译的介词短语句法功能识别,并探讨英语介词短语的具体翻译模式。本研究将韩礼德的系统功能语法引入到面向机器翻译的介词短语句法功能识别中。在机器翻译中,研究者只关注识别系统的方法,而忽略了对英语介词短语及其句法功能的研究。在机器翻译中,主要研究二元的介词短语附着问题。事实上,对于机器翻译,这种简单的句法功能分类并不够精确。本研究以系统功能语法为指导,将英语介词短语的句法功能划分为四类:状语,后置定语,补语,以及过程的一部分。同时,本研究结合词性标注的知识对英语介词短语及其句法功能进行自动识别。语料库采用小型的商务英语双语语料库。词性标注集在宾州树库标注集的基础上,针对本文的英语介词短语的句法功能块做出四点改变:区分介词与连词、定义广义小品词、定义功能词、区分介词to的不同句法功能。训练语料的建立主要采用自动识别结合人工改正的方式。识别系统采用条件随机域模型,这一模型适合小型语料库。进行对比实验,测试本研究在词性标注集的改变对句法功能识别的影响。实验1采用宾州树库词性标注集。实验2采用修改后的宾州树库词性标注集。为保证实验结果的准确性,两个实验均采用相同的五重交叉实验。实验结果表明,本研究对词性标注集的改变分别使英语介词短语句法功能识别的准确率、召回率及F值分别提高了5.06%,5.27%和5.14%。另外,本研究取得的88.45%的准确率,高于目前其他的研究方法。此外,本研究将英语介词短语的句法功能识别结果应用到介词短语翻译中。选取语料库中出现频率最高的of介词短语和in介词短语作为研究对象,提取出其翻译模式。翻译结果进一步证明,英语介词短语句法功能不同,其翻译结果不同。