论文部分内容阅读
通常,不同课程之间存在一定的关联和前后次序,例如学生学习某门课程之前通常需要先修一些课程。利用学校学籍数据库中所存放的学生成绩数据,结合数据挖掘的关联规则分析,可以从大量的成绩数据中挖掘隐藏的规律,发现有用的规则和信息,例如可以获得课程之间的知识关联,从而对学生选课提供帮助和指导,对于教学排课也可以提供科学的指导。
粒计算是信息处理的一种新的概念和计算范式,覆盖了所有有关粒度的理论、方法、技术和工具的研究,现已成为人工智能领域研究的热点之一。将大量复杂的信息进行粒化的本质是利用各种相关的知识对研究对象进行认识的深化。知识发现的过程实际上是一个粒度计算的过程。本文是基于粗糙集模型的粒计算思想,进行学生成绩数据库知识发现的研究。通过寻找课程的先修课影响课程集合,找出课程之间的制约关系,进而导出课程之间的关联规则。
由于实际学生成绩数据库数据的影响因素非常多,本文将主要以仿真成绩数据进行研究,给出学生成绩数据库知识发现的一种研究思路。首先,基于正态分布、课程依赖度等原则构造仿真数据;然后,对于该仿真成绩进行整理和预处理,将成绩表转化为选课信息表,并进行分类,得出选课次序类别;此后,利用各选课次序中课程平均成绩之间的差异寻找先修课程的影响课程集合,进行课程依赖关系的关联规则提取,给出选课的合理建议:最后,利用实际学生成绩数据对上述方法进行了初步测试,结果表明,该方法在一定程度上可以实现相关规则的提取。
此外,在研究过程中还对涉及到的相关理论问题进行了研究。
首先,研究了学生考试成绩的分布规律,提出一个学生成绩分布的数学模型。该模型的建立有助于研究学生在学习时间投入、学习效率以及课程压力等方面的基本状况,有助于提前预测学生学习的成绩基本分布,对于改进教学效果、促进学生学习积极性具有重要的意义。
其次,研究利用Vague集比较两个知识模式的相似性。Vague集理论是一种模糊集理论的推广理论,它既考虑了事物本身的模糊性又考虑了人们认识能力有限导致的未知性。针对各学者提出的Vague集(值)相似度量的公式,发现公式最后大部分都可以转化为真隶属度t与假隶属度f的关系,将这种关系用二维图形表示出来,绘制出等相似度曲线。这种相似性度量的图形化不仅可以方便地进行各种相似性度量方法的横向比较,也可以从图形分布的特点来寻求更好的相似性度量方法。该研究可用于进行学生选课次序相似性的比较,对相似程度较大的选课次序进行耦合和聚类,得出较为有效、精简的学生选课次序。
第三,初步研究了规则合成的DS证据理论。DS理论被认为是多元不确定性信息融合的有效方法,其原理是对各自独立的结论通过组合给出一致性结果,实现信息互补。该研究可在获得课程间的知识关联后,对结论进行融合,有助于获得一致性、有效的结论。从Vague集与DS理论的理论体系来看,发现两种理论有很多相似的地方,将Vague之间的相似性度量方法应用于改进DS理论的组合规则,取得了较好的组合效果。
最后,在总结全文内容的基础上,对学生成绩数据库系统知识发现研究的下一步研究重点进行了展望。