论文部分内容阅读
探索学生行为与成绩之间的关系是教育数据分析中一个重要的命题。可视分析是一种近年来兴起的利用人类视觉感知能力,通过交互式探索的方式来分析数据的手段,可以在大规模、维度高且信息密度稀疏的教育数据的分析过程中融入人的认知能力。可视分析相比传统的仅依赖计算机自动化分析的方式能发挥人在认知能力上的优势,更有效地发掘出数据中的内在模式。在可视分析这门新兴学科中,现有对学生行为与成绩变化之间的研究大多是基于学生的在线课程学习过程中产生的学习行为数据,缺少从学生在校生活情况切入,探索学生的生活行为与学业成绩关系的研究工作。本文基于大规模的学生刷卡行为的校园卡数据,从学生在校生活的角度,利用可视分析方法探究学生行为与成绩变化的联系。由于行为数据规模庞大,其本身又具有时序性,充分地展示行为数据的在时间维度上的特点,同时避免数据体量过大而产生视觉干扰成为本研究中难点之一。除此之外,行为数据信息密度低,本次研究中需要从行为数据中提炼出分析行为与成绩关系的重要特征进行可视分析。本文中设计了结合预测模型的可视分析框架,实现了可视分析系统EduRedar来研究学生的日常行为模式,探索学生行为与成绩变化之间的关系。本文的主要工作有:(1)基于可视化分析理论,提出了结合预测模型的可视化分析框架。此框架将预测模型的自动化分析能力与交互式的可视化手段相结合,作为探索学生行为与成绩变化的可视分析的新思路。(2)利用机器学习中相关预测算法,建立相应的模型为可视分析提炼特征重要性,将行为数据与成绩数据相关联。在这过程中分别采用多种预测算法建立了预测模型,并分析对比了模型效果,选用最优的模型用在可视分析框架中。(3)本文从对学生工作者日常工作的调研中得出了可视分析的目标,制定了可视化视图设计依据。同时针对数据维度高,且具有时序性等特点设计了相应的可视化映射、可视化布局算法与交互方式。(4)将可视分析视图集成,设计实现了基于成绩预测模型的学生行为数据可视分析系统EduRedar,支持对数据的多维度多角度分析。基于真实的校园卡刷卡行为数据的案例对学生行为与成绩变化进行了探索。