小句复合体理论框架下的汉英机器翻译错误分析

来源 :广东外语外贸大学 | 被引量 : 1次 | 上传用户:fengyunlcj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器翻译的研究始于20世纪40年代,最开始采用基于规则的技术,20世纪90年代之后基于统计的技术逐渐取代基于规则的技术成为研究主流。2016年,谷歌推出神经网络机器翻译,机器学习的方法成为研究热点。实践证明,神经网络机器翻译极大地减少了机器译文的错误,并提高译文的流畅度。多家互联网企业纷纷上线了基于神经网络的机器翻译系统。从基于规则的技术到基于统计的技术,再到基于机器学习的技术,机器翻译对语言结构分析的依赖性越来越低。笔者认为基于统计和机器学习的方式虽然效果显著,但由于其缺乏对语言结构的分析,必然存在相应的局限性。机器译文仍然存在很多错误也说明了这一点。基于对机器译文的观察,笔者发现目前机器翻译已经解决了很多短距离的错误,但长句翻译结果仍然不是很好。这主要是因为长句结构复杂,而英汉长句结构又有差异。因此,本文旨在从错误分析入手,以小句复合体为视角,探索汉英语言结构差异对机器翻译的影响。本研究的目的是探索汉英机器翻译中小句复合体层面错误与汉英语法差异的联系,从而为改进机器翻译,提高译文质量提供参考和建议。本文将通过研究回答以下三个问题:小句复合体层面错误如何分类?小句复合体层面错误和汉英语法差异存在什么联系?小句复合体层面错误的统计分布有什么特征?本研究收集了21篇文章作为测试语料,体裁包括新闻、百科全书和政治类文本三类。研究的具体操作步骤为:在小句复合体理论指导下将文本切分为小句复合体;将各个小句复合体输入谷歌翻译、百度翻译、搜狗翻译和小牛翻译四个在线翻译系统,得到四个机器译文;标注机器译文中的小句复合体层面错误并补充相应说明;分类错误,并从汉英语法差异的角度分析错误;统计错误并分析统计结果。定性分析表明:小句复合体层面错误可以分为词语错、共享结构错、逻辑关系错;小句复合体层面错误和汉英语法差异有关,汉英在意合与形合方面的根本性差异导致了汉英各方面的差异,进而影响了小句复合体层面的错误。统计结果表明:共享结构错和逻辑关系错在小句复合体层面错误中占比较高,堆栈结构错在共享结构错中占比最高;小句复合体层面错误的数量和小句复合体的规模成正比;不同文体中出现小句复合体层面错误的概率不同。研究说明机器翻译研究人员应该重视小句间关系的研究,以进一步提高机器翻译的质量。
其他文献
<正>2013年中国纪录片美学依然以戏剧美学和技术美学为主流,注重矛盾冲突、情节张力,追求声画质感、特技效果;与此同时,纪实美学也在大面积回归,并携带诸多新鲜元素,与戏剧美
1  鲁迅塑造的阿Q这一形象是极为复杂而又极为典型的。阿Q既有个体小生产者的自私和狭隘,又有流浪雇农的游手好闲和流氓习气,也有样样符合圣经贤传的封建思想,还有作为社会
对标管理工作如今已成为我国企业突破发展瓶颈期的关键途径,而利用国际先进企业视为标杆管理的国际对标管理,则是我国众多大型企业所择取的重点。本文深入分析了我国部分企业
目的探讨头孢哌酮舒巴坦治疗单纯性淋病所需的最佳剂量。方法选取本院在2010年10月~2011年10月期间收治的单纯性淋病患者165例,电脑随机分成3组,即小剂量组55例,中剂量组55例
<正>慢性阻塞性肺疾病简称慢阻肺,通常由慢性支气管炎发展而来,特点为气道阻塞性呼吸功能障碍。它是老年人的常见病、多发病,以气流受阻为特征。以反复咳嗽、咯痰、气促和呼
电力企业是通过终端销售和发电企业的电价之间的差额然后扣除相关的成本后作为电力企业的盈利,但是终端销售和发电定价都是国家规定的,电力企业没有权利进行更改。因此,做好
国网江苏电力开拓综合能源服务市场情况$$举措 试点建设区域综合能源服务中心。代维客户变配电设施;拓展能效监测与诊断、节能和电能替代改造、电力需求响应、光伏储能新能源
报纸
随着我国社会经济的快速发展和全民健身的不断推进,大众对健身的需求不断提高,由此造成了社会体育场馆及设施的严重不足。同时,高校在体育设施方面有着很大的优势,实现高校体
<正>在对待与中国的贸易问题上,特朗普还是拭去了前不久来中国访问时表现出的和颜悦色一面。日前,就中国根据《中国加入世界贸易组织议定书》第15条获得市场经济地位的要求,
在低温水热条件下,通过一步法合成二氧化铈纳米杆.采用XRD、SEM和TEM对合成的样品进行表征,并利用紫外线可见光谱仪对氧化铈纳米杆的抗紫外线能力进行检测.实验结果表明:用醋