论文部分内容阅读
迄今为止,教育质量仍然是国家重点的关注对象。在教学过程中,学生质量主要体现在学生成绩或者学生毕业率上。根据已往的教学经验,学生成绩在一定程度上决定了学生的通过率。本文对学生通过率的研究,主要以学生的课程通过率和学生的毕业通过率为目标。通过文献阅读和以往教学研究的经验,发现学生通过率受很多因素的影响,例如父母的教育背景、学生是否获得额外的教学支持等。教学管理者和学生个体都希望能够找出影响课程通过率和毕业通过率的重要因素。对于教学管理者而言,及时找出影响学生通过率的重要因素,可以提出有针对性的教学方案,及时改变教学方针,真正实现对学生的个性化指导,提高学生通过率,从而提高教学质量;对于学生个体而言,及时了解自己的学习现状,可以有针对性的更改自己知识盲点,提升学习的兴趣,避免产生负面情绪(退学,厌学等)。因此,通过对学生通过率进行预测,找出影响学生通过率的因素至关重要。过去,教育教学管理者主要依据已有的教学结果,粗略地对学生通过率进行猜测。然而这并不能满足教育教学管理者的需求,管理者们希望通过某种方式,可以科学地、准确地预测学生通过率,而不是根据已有结果猜测下一次的结果。因此寻找影响学生通过率的重要因素和预测学生通过率已成为教育领域亟待解决的问题。近年来,机器学习技术在各行各业都有比较好的表现,得到了广泛的认可和推广,尤其是在教育领域,研究者已经利用机器学习算法在预测学生通过率和寻找学生的关键特征两个方面进行了探索。目前,教育模式主要包括两种:在线教育和线下教育。在线教育中,研究者已经涉足学生通过率预测领域,构建出预测模型已成为研究热点,目前针对在线教育研究中还没有引入深度神经网络算法,也没有考虑学生特征之间是否存在依赖关系,存在图形结构的特征以及系数的初始化值对算法造成的影响。线下教育中,考虑到决策树算法结构简单,容易实现;支持向量机在二分类问题中具有优势的特点。研究者已经利用决策树算法和支持向量机算法在学生通过率预测领域进行率探索。但目前的研究中还未考虑特征之间存在依赖或者特征之间产生图形结构,系数的初始化值以及参数等问题对算法的影响。综上,本文所做的主要工作可以归纳为以下几个方面:(1)针对在线教育,构建一个基于改进后的深度神经网络预测模型(Improved deep neural network:FDNN)。考虑学生特征之间的依赖和存在图形结构的特征对算法的影响,本文提出特征依赖和有向无环图(Directed acyclic graph:DAG)方法的新概念,并应用特征依赖和DAG方法优化深度神经网络算法,以提高预测精度;考虑初始系数对算法造成的影响,提出初始化系数规则,以使算法尽快收敛。(2)针对线下教育,构建了基于改进后决策树算法(Improved decision tree algorithm:FGDT)的预测模型和基于改进后支持向量机算法(Improved support vector machine algorithm:FGSM)的预测模型。决策树算法和支持向量机算法虽然已经在教育领域中表现出优势,但目前的研究并没有考虑特征之间是否存在依赖关系以及存在图形结构的特征,系数的初始化值,参数问题对算法造成的影响。针对这些问题,本文提出特征依赖和DAG方法解决存在依赖的学生特征和存在图形结构的特征对算法结果产生影响,以提升算法的准确度;本文提出初始化系数规则解决系数对算法结果造成的影响,以使算法尽快收敛;本文引入网格搜索算法优化决策树算法和支持向量机算法,以提高算法的准确度。(3)实验分析。本文针对线上教育和线下教育两种模式进行实验。在线上教育中,将FDNN算法与决策树算法和支持向量机算法进行比较,以预测学生通过率。实验结果表明FDNN算法拥有较好的效果和较优的性能表现。在线下教育中,将FGDT算法,FGSM算法分别与决策树算法、支持向量机算法做实验对比,以预测学生通过率并且找出影响学生通过率的重要的学生特征。实验结果表明FDNN算法拥有较好的效果和较优的性能表现。