论文部分内容阅读
随着高校教育体制的改革,学分制的推广,学生选课的自主性越来越大。但是学生在选课的过程中,由于对所选课程需要的基础知识认识不足,导致选课具有一定的盲目性。开发一套基于现有教学管理系统中数据的学生学习指导系统来指导学生选课是很有必要的。
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据(通常是商业数据库中的大量数据)中提取出模式和知识的过程。然后在新的数据子集中验证发现的模式。数据挖掘的最终目的是辅助决策者决策。本文对数据挖掘技术尤其是关联规则挖掘技术进行了系统、深入地分析和研究,并将其投入到实际应用中。主要包括以下一些内容:
首先,在提出数据挖掘基本概念的基础上,详细介绍数据仓库的知识,并探讨了数据挖掘的模式分类和数据挖掘的过程。
然后讨论了关联规则和关联规则算法。通过分析经典Apriori算法,发现Apriorir算法的缺陷。提出了基于聚类的关联规则改进算法和基于权值的关联规则挖掘算法。基于聚类的关联规则改进算法的目的是提高算法效率,在预处理阶段先将数据聚类,缩小数据集,对关联规则挖掘算法改进后,再进行挖掘。基于权值的关联规则挖掘算法的目的是提高挖掘结果的合理性,针对于各数据项的不同地位或重要性,利用线性函数对各数据项设置权值,然后再进行关联规则挖掘。最后在基于聚类的关联规则改进算法和基于权值的关联规则挖掘算法上再添加兴趣度阈值,以达到减少算法产生的无用规则数量和提高算法性能的目的。
最后,将改进算法应用到学生学习指导系统中,通过分析学生成绩数据库,系统得到某门特定课程的先修课程。学生可以通过察看自己是否学习过某门特定课程的先修课程,来确定自己是否适合选择该门课程,实现辅助学生学习。