基于数据挖掘方法的大学英语四、六级阅读理解文本复杂度对比研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:ddall
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大学英语四、六级(以下简称“四、六级”)是我国大规模高风险的英语考试,对其进行效度研究一直是我国外语测试界关注的重要议题。然而在众多关于四、六级效度的研究中,对考试阅读理解文本本身进行分析的研究较少,而阅读理解文本在某种程度上直接影响考生的考试表现;此外,四、六级考试是同一系列但等级不同的考试,那么二者之间的差异究竟如何,学界对此的关注较少;而且,现有的四、六级考试阅读理解文本分析所涉及的文本数量有限,因而得出的结论可能不具有高度的概括性。因此,本文将采用数据挖掘方法对比分析历年来四、六级真题中阅读理解文本复杂度的差异,以期为四、六级考试的效度验证提供证据,为四、六级试题的开发提供参考,同时对语言测试研究方法的创新做出有益尝试。
  本文主要解决以下三个研究问题:(1)哪些文本复杂度特征能够有效地区分四、六级阅读理解文本?(2)四、六级阅读理解文本复杂度具体有何差异?(3)在本文使用的三种数据挖掘方法(决策树算法、逻辑回归算法、朴素贝叶斯算法)中,哪一种方法的分类效果最好?
  首先,本文收集了四、六级历年真题中的阅读理解文本,其中四级阅读理解文本共251篇,六级文本共253篇;然后用自动文本分析工具Coh-Metrix提取了上述阅读文本在词汇、句法、语篇层面共45个文本特征;采用了三种数据挖掘算法基于上述文本特征对两类文本进行自动分类;数据挖掘实验在WEKA中进行,经过特征选择,共获得三个特征集;最后,用上述三种算法分别在三个特征集上训练分类模型,再筛选出分类效果最好的模型和特征集。
  本文得出如下结论:
  (1)研究发现,在特征集Ⅱ上的文本分类效果最好,分类正确率达81.94%,精确率达82.35%,召回率达81.9%,F1值为81.9%,ROC面积为0.83,即词汇多样性、句法相似性、总词数、叙事性、时间连贯性、词汇熟悉度这六个文本特征能够有效地将四、六级阅读理解文本区分出来。
  (2)对于上述六个文本特征,六级阅读理解文本与四级阅读理解文本的对比如下:词汇更多样、总词数更多、实词熟悉度较小、句法相似性较小、叙事性较小、时间连贯性较小。
  (3)在决策树、逻辑回归、朴素贝叶斯这三种数据挖掘算法中,决策树模型在三个特征集上的分类效果皆最佳。
  基于上述研究发现,本研究为四、六级阅读理解测试的效度验证提供了证据,为四、六级阅读理解试题的开发提供了参考,为语言测试研究方法的创新做出了有益的尝试。
其他文献
摘 要:随着我国经济的快速发展,社会对高技能烹饪人才的需求快速增长,烹饪专业也得到了较快发展。烹饪化学是烹饪专业必修的基础学科,烹饪化学实验作为烹饪化学教学的重要一环,可使学生更直观的认识和理解相关知识点。目前国内针对高等职业教育层次的烹饪化学实验教学内容研究较少,尚无与烹饪化学相配套的实验教学指导性教材。探讨并寻找烹饪化学实验课程教学内容的改革方向,具有重要的实际意义。  关键词:烹饪专业;烹饪
期刊
摘 要:伴随着中国本土服装品牌的崛起和市场对设计要求的不断提升,一方面许多企业纷纷面临人才资源匮乏的困境,另一方面服装专业学生的综合能力和实践水平遭遇严重的质疑和残酷的竞争。如何保证学院教育的含金量,切实的提升学生综合素质并利用有限课时快速提升学生的实践能力,成为专业教育工作者的重要目标。从课程内容之间的相互呼应和贯穿入手,利用连续型的课题任务布置,是本文将探讨的一种基于以上目标的实验教学方法。 
期刊
摘 要:加强信息技术教育是中小学课程改革的重要举措。但在中小学信息技术教育中应克服形式化、盲目化、数字分化、纯工具化和德育淡化等不良倾向,准确把握课堂教学方法,以提高中小学信息技术教育的绩效。  关键词:小学信息技术;教学效率  课堂教学效率是指单位时间内课堂教学的效果,它不但是预期教学目标实现程度的综合反映,而且是评价教学优劣的重要指标和整个教学过程动作状态是否良好的重要标志。课堂教学是实施素质
期刊
摘 要:"过程→生成"教学理念认为:教学要向学生展现"有价值有思想有活力的、顺应学生思维与教育规律的、具有整体性连续性生成性的知识生成过程",基于"过程→生成"教学理念,给出了行列式概念的教学设计。  关键词:"过程→生成"教学理念;行列式;教学设计  教学改革最根本的问题是观念问题,如果传统的注入式观念不能根除,那么改革就只能是娓娓动听的空谈阔论,所以我国的教育改革的根本点是教学观念上的破旧立新
期刊
摘 要:因特网飞速发展,已经渗透到生活的方方面面,也成为我们获取知识的重要途径。网络教学(E-learning)正迅速普及,可以说,从基础教育到高等教育,从教师教育到专业培训,涉及各领域各层次的成千上万门课程都能通过因特网获取。网络教育亦将成为未来主要教育方式之一。网络课程为广泛的各层次的人群带来了多方面的效益。然而,蕴藏在在线课程中的版权问题亦可能引发复杂的利益冲突。可以肯定的说,目前网络课程里
期刊
摘 要:课堂小结在课堂教学中经常被忽视,而课堂小结是完整课堂教学过程的一个环节,是一种最有效的教学策略,教师在课堂教学中要留足时间,采用回顾总结法、探索解惑法、拓展延伸法进行有效的课堂小结。  关键词:课堂小结 回顾总结法 探索解惑法 拓展延伸法  明朝的布衣诗人谢榛对文章的开头、结尾用了两个比喻:"起句当如爆竹,骤响易彻;结尾当如撞钟,清音有余"。课堂教学也应如此,重视课堂导入和课堂小结,而在现
期刊
摘 要: E R P沙盘模拟对抗教学是集知识性、 实践性和趣味性为一体的体验式教学模式。本文通过对沙盘模拟的优势分析,结合培养应用型会计人才培养目标对目前职业学校沙盘模拟教学提出几点看法。  关键词:职业学校 沙盘模拟教学 建议  目前中职学校会计专业实践教学大都流于形式 一方面理论教学占据主导地位, 对会计技能教学部分不够重视,另一方面要将理论与实际相结合,最好的办法是让学生到企业实习,在实习的
期刊
近年来,金庸小说的外译及其研究引起了学界的广泛关注。现有的金庸小说英译研究主要集中在金庸小说中文化元素及武侠术语的翻译,鲜有学者关注武打动词的翻译。金庸小说中对于打斗场面的描写占据了大量篇幅,武打动词作为打斗场面描写的重要组成部分为读者对武打动作的认知提供了根本依据。
  具身认知理论认为人的认知来自于基于身体经验而形成的抽象思维,人的语言理解也植根于人们的感知和动作系统,语言描述能够激活人的脑海中对所描述的事件身临其境的经历。本研究根据具身认知理论提出武打动词的翻译原则,并在此原则基础上对金庸小说
随着越来越多的学生在新的文化环境中学习前沿知识并拓宽他们的视野,高等教育跨文化的特征愈发明显。跨文化交际领域的研究人员逐渐认识到跨文化适应的重要性并展开相应的研究,从而加深对这些学生跨文化经历的认识。先前的研究聚焦于探索诸如社会支持、文化距离、海外学习经历等社会因素以及其他人口统计学因素在跨文化适应中的作用,但是对于这些因素的预测性作用,相应的研究结果并不统一。有一些研究人员认为或许其他的某些因素能够更好的解释跨文化适应的过程,并开始对性格这一因素展开研究。为顺应目前研究趋势,弥补研究缺陷,本文对在台湾大
本文主要研究在英汉语境下,具有相同“给予”义的英汉“给予”类动词在语义特征和句法表现上的异同,并试图探寻英汉“给予”类动词的语义—句法联接模式。本文旨在填补国内外对于“给予”类动词在语义—句法联接模式上的研究空白,为英汉动词对比提供新思路。
  本研究在回顾英汉“给予”类动词研究的基础上,以COCA语料库和CCL语料库为依托,借鉴Levin(1993)对于give-verbs的分类,并参考《汉语动词用法词典》,选取“pass--递(di)、sell--卖(mai)、rent--租(zu)”三组词为英