决策树分类算法的研究及其在教学分析中的应用

来源 :河海大学 | 被引量 : 27次 | 上传用户:maigao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘(Data Mining)又称数据库中的知识发现,是一个从大规模数据库的数据中抽取有效的、隐含的、以前未知的、有潜在使用价值的信息的过程,它是当今众多学科领域特别是数据库领域最前沿的研究课题之一。对数据挖掘技术的研究,国内外已经取得了许多令人瞩目的成就,并成功地应用到了许多领域。 在高校的学生管理、教学工作科学化的今天,传统的教学管理手段已逐渐不能适应社会发展的需求。与此同时,数据挖掘技术的快速发展及其应用领域的不断扩大使得将数据挖掘技术应用于高校的教学、管理已是必然的趋势。如果以历届的教学信息库为数据源,利用学生、教师及教材等情况信息,使用数据挖掘技术发现以上各要素对学生课程成绩影响的强弱,挖掘结果将可用于合理的设置教学方案。 一般情况下,可将数据挖掘算法分成分类和预测、聚类分析、关联规则挖掘等几种,其中决策树分类算法是其中最重要最常用的技术之一,也是目前研究的热点问题。基于以上情况,本文做了如下工作: 1.对各种决策树分类算法进行了详细介绍,研究了每种算法的主要优缺点; 2.以学生课程成绩与教学要求、教材选用、教师情况和学生情况之间的关系为前提,利用决策树分类算法ID3的传统实现途径开发了学生成绩分析系统; 3.在认真分析传统实现方法所存在的问题后,提出了改进的实现途径CASP(Classifying Algorithm on Server Procedure),并也将其实际应用于学生成绩分析系统。和传统的实现方式相比,通过理论分析和实际数据测试,证明了改进的实现方法CASP较好地解决了ID3算法实现中的空间复杂度和计算复杂度等问题。 在系统设计方面,采用了模型-视图-控制器MVC(Model-View-Controller)的设计模式,利用VB.NET及SQL Server 2000数据库进行了实现。系统分为两个部分:数据训练和数据预测。在数据训练部分,首先对教学历史数据(训练集)进行清洗、连续数据离散化,之后通过挖掘系统生成决策树和形成相应的规则;在数据预测部分,对需要预测的数据按规则测试,给出测试可视化界面和预测结果。实践证明,此系统可以为教学质量分析和教学课程安排提供重要的依据。
其他文献
本文的课题来源于辽河油田钻采工艺研究院的实际项目——采油工程数据集成平台。该项目对采油工程信息化建设系统、开发决策支持系统、勘探数据系统、院或采油厂生产系统等进
CTCS-3(China Train Control System level 3)级列车控制运行系统是保障我国铁路时速300~350 km客运专线高速列车安全、可靠、高效运行的核心技术之一。然而,对于列车控制运
网格技术是近年研究较热门的一项技术,利用互联网把分散在不同地理位置的计算机组织成一个虚拟的超级计算机,未来互联网的发展方向也许就会是将网络中众多闲置的计算资源,存
路径规划问题是自动化移动系统研究中的一个基本问题,此问题的目的是在简单多边形环境中生成一条机器人从起始点到目标点之间的路径。如果搜索是在未知环境中进行时,即搜索环
随着仪器仪表发展,仪器仪表已经渗透到人们生活的各个领域,成为人类获取信息、认识自然、改造自然的重要工具,而今仪器仪表的发展水平更是成为现代科技发展水平的一个重要标
对等网络(Peer-to-Peer Networks,简称P2P网络)是采用对等模式工作的计算机网络,是分布式系统与计算机网络相结合的产物。目前,P2P网络已经被广泛应用于Internet环境下的文件
现代科学技术的发展极大地促进了计算科学的进步,同时人类对计算的要求也在不断提高。然而,由于芯片制造上的物理限制,单CPU的速度已快接近极限,性能提高越来越难。因此,要想再大
对图像数据进行有效分析之前,图像的平滑和分割是最重要的步骤,它们的成功与否,直接影响后续工作的质量。近年来,基于偏微分方程的图像处理受到了研究人员的广泛关注。将图像的处
由于长期不正确姿势使用电子产品,脊椎疾病已经成为人群中的常见疾病。脊椎领域的相关研究成为了新的研究热点。随着计算机图形图像的技术发展,将可视化技术引入医学领域,能
近年来,校园信息化建设已成为世界各国教育竞相发展的热点,数字校园、虚拟校园等发展势头迅猛,其明显特征之一是:它提出了对更多种类信息进行处理的要求,如表示校园地物资源或设施