论文部分内容阅读
数据挖掘(Data Mining)又称数据库中的知识发现,是一个从大规模数据库的数据中抽取有效的、隐含的、以前未知的、有潜在使用价值的信息的过程,它是当今众多学科领域特别是数据库领域最前沿的研究课题之一。对数据挖掘技术的研究,国内外已经取得了许多令人瞩目的成就,并成功地应用到了许多领域。 在高校的学生管理、教学工作科学化的今天,传统的教学管理手段已逐渐不能适应社会发展的需求。与此同时,数据挖掘技术的快速发展及其应用领域的不断扩大使得将数据挖掘技术应用于高校的教学、管理已是必然的趋势。如果以历届的教学信息库为数据源,利用学生、教师及教材等情况信息,使用数据挖掘技术发现以上各要素对学生课程成绩影响的强弱,挖掘结果将可用于合理的设置教学方案。 一般情况下,可将数据挖掘算法分成分类和预测、聚类分析、关联规则挖掘等几种,其中决策树分类算法是其中最重要最常用的技术之一,也是目前研究的热点问题。基于以上情况,本文做了如下工作: 1.对各种决策树分类算法进行了详细介绍,研究了每种算法的主要优缺点; 2.以学生课程成绩与教学要求、教材选用、教师情况和学生情况之间的关系为前提,利用决策树分类算法ID3的传统实现途径开发了学生成绩分析系统; 3.在认真分析传统实现方法所存在的问题后,提出了改进的实现途径CASP(Classifying Algorithm on Server Procedure),并也将其实际应用于学生成绩分析系统。和传统的实现方式相比,通过理论分析和实际数据测试,证明了改进的实现方法CASP较好地解决了ID3算法实现中的空间复杂度和计算复杂度等问题。 在系统设计方面,采用了模型-视图-控制器MVC(Model-View-Controller)的设计模式,利用VB.NET及SQL Server 2000数据库进行了实现。系统分为两个部分:数据训练和数据预测。在数据训练部分,首先对教学历史数据(训练集)进行清洗、连续数据离散化,之后通过挖掘系统生成决策树和形成相应的规则;在数据预测部分,对需要预测的数据按规则测试,给出测试可视化界面和预测结果。实践证明,此系统可以为教学质量分析和教学课程安排提供重要的依据。