论文部分内容阅读
数据挖掘是一门从大量数据中根据特定算法挖掘潜在信息,供研究者进行分析的技术。现在已经广泛应用于各大领域,并取得众多有价值的研究成果。聚类分析是数据挖掘的模式之一,其功能是将样本数据按照相似性规则分类,使同一类之间数据相似性高,不同类之间数据差别性大,通过聚类能刻画事物的特征性。群体智能是生物学、计算机技术等多门学科的交叉领域,是自然界中无智能或者低智能的单个个体,受群体之间的相互影响、协作能完成复杂的具有智能性任务的模式。20世纪90年代意大利学者M.Dorigo等受自然界中蚂蚁能够在蚁穴与食物源之间搜索最短路径行为的启发,提出蚁群算法,成功解决了诸多组合优化问题例如旅行商、TSP问题、图着色问题等。基于蚁群算法的聚类分析因其能弥补传统聚类算法所存在的需预先设定聚类条件的不足,成为近年来研究聚类分析的一大热点。本文在Lumer和Faieta提出的蚁群聚类算法基础上提出了两点改进,一是对蚂蚁访问过的数据对象进行记录,能保证所有数据都被遍历到,同时防止同一数据被反复的拿起以及放下;二是建立一张“历史位置全局记忆库”,引导蚂蚁有目的性地较快放下所负载的数据对象,同时也能有效地避免局部最优解的出现。通过改进算法与未改进算法的实验对比验证改进算法具有较好的性能,能提高聚类的收敛速度和聚类结果的准确性。最后,将改进的算法应用于学生成绩评价的挖掘中,包括学生成绩的综合评价和单科成绩的等级评价。综合成绩评价的挖掘,能够对学生的整体能力进行不同类别的宏观分析,可以帮助教务决策,供教学支持,以便于因材施教。而单科成绩的等级评价的聚类,能够弥补传统成绩等级评价方式不根据外部影响而进行灵活改变的不足,实现动态等级评价。最后根据传统的等级评价标准的结果与动态的等级评价结果的对比,印证了根据聚类算法进行动态学生成绩评价的合理性和可行性。以上两种模型的聚类分析,表明将数据挖掘引入到教学环境中是有意义的。