基于数据仓库的学生成绩分析与研究

被引量 : 15次 | 上传用户:dfvgbergbeg435
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我校研究生院信息化建设工作的开展,研究生综合教务系统已投入使用。但是目前系统中只实现了基本的数据查询和数据备份的功能,分析功能还比较弱,系统中积累了大量学生的数据得不到充分的利用。在这些数据中学生成绩是衡量学生综合素质的一个重要指标,同时也是评估教学质量的一个重要指标,而教学质量的好坏直接反映出学校的综合实力。因此学校的决策人员也更加关心学生成绩的分布情况以及学生成绩的影响因素等信息,从而采取相应的办法来提高教学质量。因此本文将学生成绩作为分析与研究的对象,首先建立了学生成绩数据仓库。数据仓库的建立过程包括建立三级数据模型以及多维数据集的建立,之后通过EXCEL透视表服务展现了学生成绩的分布情况并得出一些结论。同时为了进行更加深入的研究,引入了决策树分析方法和关联规则分析方法。在确定数据集之后,分别建立了基于ID3算法和C4.5算法的决策树模型,分析学生的基本信息情况对学生成绩的影响,之后使用测试集数据对两种算法的准确率、召回率、F值进行验证并对比了两种算法的实验结果,发现C4.5算法相比于ID3算法准确率更高,而且C4.5算法在决策树的构造过程中就进行剪枝,使创建的决策树叶子结点的个数相对少些,结构也更紧凑些;并且生成的规则更简洁、也更容易被理解,更能满足决策人员的需要。因此根据C4.5算法建立的决策树得出了适用于招生决策的一些结论。在本校学生的培养方案中,学生学习的课程,是按照公共课、基础理论课、专业基础课的先后顺序进行安排。其中,公共课是基础理论课的基础,基础理论课是专业基础课的基础;前期开设的专业课的学习效果对与之有关联的后期开设的专业课的学习也有很大的影响。因此本文实现了关联规则分析的经典算法—Apriori算法,找出学生公共课、专业基础课、基础理论课成绩之间的关系,并得出一些预测性的结论,同时也为研究生招生工作提供决策支持。
其他文献
<正> 一、引题:一部庄严宪法,没有提及律师制度众所周知,宪法是国家的根本大法,所提及的问题都是国家的根本问题,并就这些根本问题只作原则性的规定。至于普通法律则是根据宪
会计稳健性最早产生于民商法,至今已经发展了近600年的时间,而对其存在性及其对企业的影响的研究却始于20世纪90年代,直至21世纪初,才有学者研究会计稳健性的影响因素。目前,
本文在服务业生产率及其影响因素的分析中,引入社会资本因素,采用信任、交互、互助和社团测量我国各省市的社会资本水平。运用随机前沿生产函数模型(SFA),根据1993~2007年数据
我并不喜欢忆旧,哪怕我们这代人见证了中国近三四十年来翻天覆地的变化,而且就个人经历而言,回想三十多年前的自己,几乎有恍若隔世之感。胡适有《四十自述》,我就觉得这位胡
珠三角地区的软土具有含水量大、压缩性高、承载力低等特性,对基坑工程的设计和施工都提出了更高的要求,深基坑支护设计和施工面临诸多挑战。因此,本文以珠三角公路隧道深基
感知运动协调(sensorimotor synchronization)是指个体动作对外部环境节奏在时间上的协调,是运动表现和外界环境的重要枢纽。感知运动协调是影响个体日常生活和工作的一项重
本文以比-较优-势理论为依据,通过估算国内资源成本系数(DRCC)来测定我国种植业主?吩诠适谐∩纤哂械谋冉嫌攀萍捌渌承?为全国及各省市自治区的结构调整提供意见
目的:总结3例重度子痫前期并发急性心力衰竭患者围手术期的护理体会,特别是液体管理及呼吸机治疗方面的护理,为临床护理和治疗提供指导。方法:回顾性分析2014年收治的3例重度子痫
每个作家都应该是生命的歌者,因为他们都是在自己生命体验的基础上创作出了优秀的作品。史铁生是一位特殊的生命歌者,因为他虽然身患残疾但是却唱出了最饱满的生命之音。史铁
图像资料在高中历史教材中的使用是非常广泛的。现行不同版本的高中历史教材中,都使用了大量的图像资料。本文以岳麓版历史教材必修一为例,着重探讨图像资料在高中历史教学中