论文部分内容阅读
近年来,随着大数据时代的到来,基于数据的统计学习方法已经引起了全世界范围内的广泛关注,通过数据挖掘技术获取的规律和信息已经在包括市场分析,商务管理,工程设计,科学探索等多方面得到了广泛应用。高考一直是国人较为关注的话题,统计学习方法是通过数据挖掘技术,从指定的数据中获取人们所需的相关信息,让人们作出更加实用有效的决策来解决相应实际问题的方法。本文将借助于统计学习方法来对高考进行科学合理的预测。当前,统计学习方法的应用领域十分广泛,诸如语音识别,股票预测分析,生物信息统计等。在统计学习方法中,K近邻方法是一种应用较为普遍的学习方法,并且具有较好的推广。有鉴于此,本文以K近邻算法为主要工具,进行高考成绩的预测分析。在确定好所用方法模型之后,接下来就需要收集数据。为了对高考进行合理且科学的预测,本文以湘潭市某所具有代表性的普通高中2016届高三学生为对象,整理了 652名考生的四次模拟考试成绩和高考成绩,删掉缺考人员的数据后,一共得到520名考生的考试成绩。然后用K近邻算法来分析并处理这些数据,对高考分数和录取批次进行预测。基于收集到的数据集,在实验中,本文主要涉及到了两种情况,分别是高考基础分的预测和高考录取批次的预测。在实验的结尾,将实验结果和2016年高考实际情况进行对比,同时还将K近邻方法下的实验结果和神经网络方法下的实验结果进行了横向对比,结果均显示了 K近邻在高考预测方面具有良好的准确性和可行性。