基于C5.0决策树算法的学生成绩预测算法研究与应用

来源 :吉林大学 | 被引量 : 0次 | 上传用户:pinkoath
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2020年初,随着我国新冠疫情的爆发和蔓延,全国各地高校授课均受到严重影响,通过网络教学模式取代传统教学的模式已经成为疫情之下的必然选择。目前,我国拥有众多在线公开教学平台,均能够实现教师在线为学生教授课程的功能,但是网络教学依然存在不足之处,如教师很难观察到学生的学习状态从而及时辅导学生的课堂功课等弊端,这些问题会间接增加教师掌握学生学习情况的难度,在这种背景下,分析并提高网络教学效果一直是教学研究的热点问题。在网络教学情况下,为了让教师能够及时追踪学生的学习行为和学习状况,本文提出一种整合性的分析算法。借助此算法,教师可以利用现有的学习记录文件,通过多个观察维度分析出学生的学习行为。此外,该算法利用C5.0决策树算法分析预测出可能达不到预期教学目标的学生,让老师可以及时给予适当的教学辅助,以达成教学目标。本文的研究内容主要包括以下两个方面:1.基于C5.0决策树提出一种学生学习成绩预测的算法。该算法通过学生学习行为因子数据表,确定决策树的输入变量和输出变量。然后,将所有样本随机划分为三个数据集,分别用于训练、测试和验证,据此分析学生学习行为特征,从而为学生成绩预测提供算法依据。C5.0决策树算法分别建立了三个与学习记录分析相关的数据库:学生学习记录数据库、学生学习类型数据库、教学决策支持数据库。此外,通过对本研究产生的决策规则结果进行分析,其中主要分为以下三个部分:第一,针对第五学期及第六学期的各门课程找出学生的各种学习行为属性与学习成效之间的决策规则,并对产生的决策规则加以说明。第二,为了验证找出的决策规则,本研究用不同学期的同一课程作为验证的对象,并使用第五学期、第六学期以及第七学期的数据分别作为训练数据与测试数据,以决策树分析中的训练错误率以及测试错误率作为验证的指标,以试图通过不同的时间单位来找出最佳的预测时间点,也用不同的成绩等级分类方式试图找出最佳的成绩分类方式。第三,将分析对象区分为整体的学生、高分群的学生以及低分群的学生。2.基于C5.0决策树构建的学生学习成绩预测决策树对学生的学习情况进行分析和讨论,并针对数据分析结果给出具体的教育指导意见。本研究通过处理这些异质的大规模学习记录,从不同课程下课程属性与决策规则的关系、不同时间单位下各时间点与决策规则的关系、不同成绩等级分类方式与决策规则的关系、不同时间单位下各时间点与高分及低分预测效果的关系、不同成绩等级分类方式与高分及低分预测效果的关系等角度分析学习记录信息,对学生的学习行为进行分类,最终达到根据学生目前的学习情况预测出学生潜在的学习效果的目的。
其他文献
目的了解北京市一线抗结核药品不良反应发生情况和对化疗工作的影响。方法采用前瞻性研究,选择包括城区、近郊区及远郊区共5个区自2006年7月—2007年1月的所有使用一线标准化
在PLC控制系统使用Profibus-DP工业控制总线时,一旦DP主从站通讯模块出现故障,将影响整个控制系统工作,主要介绍了一种使用LabView与OPC服务器数据交换替代PLC通讯中DP主从站
文章对我国人际竞争情报的相关研究领域进行了梳理和客观评价,并分别从人际竞争情报搜集与传播、人际竞争情报网络建设、人际竞争情报系统开发、人际竞争情报规划和人际竞争
背景及目的血管免疫母细胞性T细胞淋巴瘤(AITL)大约占外周T细胞淋巴瘤(PTCL)的15-20%,近年来发病率呈上升趋势。其临床过程呈侵袭性,多为老年人,传统化疗有效率低下,缓解时间短,易复发,复发后治疗效果差,反复化疗耐受性差。本研究着眼于探寻更有效、便捷且耐受性好的治疗方案以提高患者生活质量。同时,分析其临床特征,探讨影响预后的因素。方法选择我院2015年1月至2018年5月期间经病理确诊的
通行费收入预测在高速公路建设及项目可行性研究方面具有重要意义。通行费收入预测包括交通量、收费标准和收费里程三个要素。通过对计重收费模式下高速公路通行费收入预测过
改革开放四十年以来,齐齐哈尔市国民经济稳健发展,产业结构不断优化,固定资产投资拉动力不断增强,民生水平明显改善,城市软实力显著提高,经济社会发生了巨大变化,铸就了齐齐哈尔市经
目前“读书无用论”有所抬头,农村在校大学生比例下降。究其原因一是就业难,二是求学成本趋高。就业难的背景是金融危机经济低迷,主要靠政府的宏观调控来实现,但求学成本趋高
建筑工程的重要分项工程,保证建筑电气施工安全对整个建筑生命健康发展起到重要作用。文章分析安全管控在建筑电气工程施工中的具体应用,希望为建筑电气工程的发展提供帮助。