数据挖掘技术在教务管理中的应用

来源 :安徽大学 | 被引量 : 0次 | 上传用户:wzy4225
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国家教育战略的推进和社会经济的迅猛发展,对各类应用型人才的需求量也愈来愈大,广播电视大学开展的现代远程开放教育的办学模式已愈来愈为社会各界广泛接受。近年来,各地电大主动适应社会需求,结合地方社会经济发展的需要开设专业,加大招生宣传的力度,取得了良好的招生业绩。然而在招生人数增长的同时,也存在着学员流失的问题。学员入学后是否留得住,能否不流失或者少流失,这不仅关系到电大的发展,也是国家实施远程教育战略中的一大问题。数据挖掘技术正是分析这个问题的可行而有效的方法。本文试图基于数据挖掘技术从数据角度分析学员流失的主要原因,并力图提供一个解决方案,在学员即将流失前采取措施预防学员流失。首先收集各种资料,包括已有的分析材料和统计数据,对这些资料进行分析,初步分析出学员流失的可能原因,从而确定问题的范围和研究主题。根据初步的确定的研究范围,对已有的各种数据源进行分析,结合研究主题对数据源进行筛选,从而既保证概括所有有价值的数据,也能保证数据源范围在合理范围内。经过分析比较,我们选择了教务数据和成绩数据作为分析对象。再对教务数据和成绩数据进行深入剖析,弄清事实与维度,从而构造出流失率分析数据仓库数据模型,再结合具体的数据库系统设计数据存储结构,构建出流失分析数据仓库。然后通过数据清理、转换等步骤对教务数据和成绩数据进行规范化处理,导入到数据仓库中。然后利用决策树分类方法进行分析。先将数据仓库中的数据分为两部分:训练样本和测试样本。再利用C4.5算法对训练样本进行处理,建立学员流失分析决策树模型,由决策树模型导出分类规则。然后用测试样本对所生成的分类规则进行测试,从测试的结果看,得到的分类规则准确率较高。最后根据生成的决策树模型和生成的学员流失规则编制了学员流失预警系统。有了学员流失预警系统后,导修主任或教务人员在预防学员流失不再“普遍撒网”,而变得“有的放矢”,有效地防止了学员流失,因此,基于决策树方法的学员流失分析模型达到了预期目的。
其他文献
现在我们处在信息急速爆炸的时代,这时候很难做到为用户提供符合心意的有用信息。因为搜索引擎的出现,用户减少了部分信息过载压力,但存在结果单一性问题,无法提供差异性的可
随着云计算、大数据以及物联网等技术的迅速发展,数据的存在形式发生了变化。在许多实际应用中,产生的数据大多数以数据流的形式存在,如网页搜索日志数据、传感器网络数据、
随着Web服务的流行,Web服务的数量与日俱增,经常会出现多个Web服务满足同一功能请求,对于如何从中选出最优的服务,现有基于功能性描述的Web服务发现方法无法解决这一问题。所
探地雷达(Ground Penetrating Radar,GPR)作为一种高效率、结果直观的浅层物理探测技术,以其无损、高分辨的特点,被广泛应用于环境工程、地质勘探等多个领域。由于地质环境复
我国的煤矿井下供电网大多数采用了小电流接地系统,该系统发生单相接地故障的概率很高。对于井下特殊的工作环境,如果发生了单相接地故障,必须及时地处理,避免故障扩大,影响整个供电系统的安全运行。长期以来,尽管很多学者进行了大量的研究,但是选线准确率达到100%的选线装置还不存在,并且适用于煤矿井下的小电流选线装置几乎没有,因此设计一套经济实用、符合煤矿特殊的供电环境并能快速准确地实现故障选线的装置,具有
随着互联网的快速发展和广泛应用,Web Service已经成为网格和分布式计算基础结构和应用构建的标准,基于Web Service的分布式计算模式也逐渐成为应用模式和软件相关技术发展的
随着互联网的飞速发展,信息爆炸已经成为一个很严峻的问题。面对互联网中海量的信息,想要快速有效地获取所需信息变得越来越困难。如何为用户提供简洁有效的信息、满足用户个
全国大学生英语四六级网考在教育部的推进下渐渐成形,四六级作文的自动评分成为一个随之出现的新课题。以往四六级作文阅卷采用人工评分,工作量很大,且很难保证评分的准确性和客
随着计算机网络和分布式系统的快速发展和普遍应用,应用系统的形态正从面向封闭的、熟识用户群体的、相对静态的服务模式向开放的、公共可访问的、动态协作的服务模式转变。
利用数据发现结构模型中的因果关系是机器学习领域中的一个重要研究内容。当前的结构模型因果发现主要有两类,一种是直接利用观察数据的被动学习方法,另一种是结合观察数据和