论文部分内容阅读
英语作为世界上使用范围最广的语言之一,它在中国与世界的沟通交流中发挥着至关重要的作用。然而英语中的语法学习对于英语学习者来说是一个困难而又漫长的过程,尤其在英语写作中,英语学习者难免会犯各种各样的语法错误。所以研发一种用于纠正英语写作中出现的各种语法错误的模型是极其重要的,这样做不仅可以应用于英语文本的自动检查与校对,而且能使学生达到自主练习的目的。 本文基于中国大学生英语作文,分析了中国大学生写作常犯的语法错误,并针对这些语法错误建立了规则与统计相结合的英语作文语法纠错模型和从句关联词纠错模型,实现了对英语作文的智能检查与纠正。 本文的研究成果主要分为以下两个部分: 1、针对中国大学生常犯的语法错误,实现了基于规则与统计相结合的语法纠错模型。首先收集并编写了包含大量语法规则的语法规则库,又进一步编写了语法规则编写器以方便以后对该规则库的维护和扩充。把语法规则库中的规则分为较易产生误报和不易产生误报两类,在规则语法纠错处理模块之后,采用三元语法模型只对较易产生误报的那一类规则进行进一步进行过滤和补充,并为该模块加入了Kneser-Ney平滑算法,从而增加了模型的纠错处理的准确率和语法错误纠错种类。 2、为提高英语从句关联词纠错能力,提出了一种基于遗传算法的自动特征选择和KNN算法相结合的自动英语从句关联词纠错模型。模型首先提取了相关的语法特征,然后使用遗传算法和KNN算法结合,搜索出针对该算法的最优特征子集。最后通过实验,对实际数据进行了实验验证与比较。结果表明,本文提出的关联词纠错模型,能够较大的提高模型纠错效率,进而证明了本模型的有效性和可行性。