论文部分内容阅读
研究使用Weka大数据挖掘技术平台对数据进行挖掘分析。采用Weka的离散化技术对样本数据进行关联规则挖掘的方法,使用SimpleKMeans聚类算法对模拟样本数据进行聚类分析,从中挖掘每一类数据的共同特征以及不同簇间数据的区别所在,对各种数据区间划分,分析不同区域的数据分布。举例挖掘研究项目,以某校高考成绩数据为模拟样本,以语文、数学和英语高考成绩为分析对象,进行大数据挖掘研究,得出在文理科分班下,语、数、外总分成绩分别对比分布结果。综合运用统计分析和数据挖掘技术,深入地对高考成绩数据进行挖掘分析,获得以成绩聚类为主的潜在有用信息,具有较强的理论价值,能对高考模式改革起到帮助作用,对高考教育起到一定的指导作用。