论文部分内容阅读
随着高校办学规模的不断扩大,学生人数的增加,高校使用的各种管理系统中如学籍管理、成绩管理等积累了大量的数据,人们只能通过简单的操作获得数据表面的信息,而隐藏在这些大量数据中的信息并没有被充分挖掘和得到应用。本文使用数据挖掘技术对高校学生的英语四级成绩(在文中简称CET-4)进行挖掘分析,以期找到影响学生四级成绩的主要因素,从而为教师改进英语教学和指导学生学习英语提供科学依据,为学生学习英语和复习CET-4考试提供帮助。1.运用决策树分类技术中的C5.0算法对学生的CET-4考试成绩进行挖掘分析,首先使用数据挖掘工具SPSS Clementine12.0构建决策树模型,在构建的过程中对决策树进行有效的修剪,然后提取分类规则,最后对分类结果进行分析总结,分析出CET-4考试中听力、阅读、写作三个部分对CET-4总成绩的影响程度,为教师改进英语教学提供科学依据,为学生复习CET-4考试提供帮助。2.采用聚类分析方法中的K均值算法对学生的CET-4考试成绩、大学英语平均成绩进行分析,根据聚类结果,将学生分成不同的类,根据每个类中学生的特征指导学生学习英语和复习CET-4考试,提高学生的CET-4考试合格率。3.设计了大学生英语四级成绩影响因素调查问卷,使用SPSS19.0对问卷调查的数据进行处理,将所得结果与数据挖掘分析结果进行了比较,对数据挖掘结果进行了验证,然后综合归纳得出影响CET-4成绩的主要因素,并从教师、学生、学校管理决策者三个角度分别提出相应的建议。在本研究中,按照上述方法找出的大学生英语四级成绩影响因素真实可靠,对教师的教学和提高学生英语四级考试合格率有一定的指导作用。