论文部分内容阅读
在信息技术与教育融合的新型在线学习环境下,理解在线学习者的学习规律进而预测其学习成效,对于提升在线学习者的学习效果、效率及体验具有重要意义。本文首先探究在线学习行为时空分布规律及其与学习成效的关系;研究在线学习过程中学习认知参与深度相关因素,构建认知参与深度的自动评测模型;进而,提出基于学习过程序列数据图像化处理方法及学习成效预测模型;更进一步,为了提高学习成效预测模型对风险学生的识别精度,提出了基于堆叠策略的两级增强集成模型及算法以解决单边预测模型效果较差的问题,并提出了基于潜在特性变分自动编码的整合预测框架以改善不平衡教育数据集对学习成效预测的影响。本文的主要研究工作具体如下:首先,为了刻画在线学习行为的时空分布规律,本文提出基于学习时间熵与学习位置熵的时空分布特性分析方法,并探究不同类型学习者的时空行为分布特征,揭示不同时空行为模式与学习成效的关系。实验结果证实了熵分析是研究在线学习行为时空分布规律的一种合适方法,并发现频繁的学习位置变化不利于好的学习成效。其次,为了理解在线学习者的认知参与深度,本文基于论坛交互数据识别在线讨论过程中的认知参与深度与认知规律。鉴于认知参与深度不仅与讨论内容的语义相关还与思考和表达的方式有关,因此提出了多特征融合的学习者认知参与深度自动评测算法,以准确便捷地了解在线学习思考过程和交互深度。实验结果表明,多特征融合的高阶认知评测方法能有效地识别各类认知参与深度的讨论帖子,且不同类型的文本特征有着不同的评测优势。第三,基于在线学习过程数据蕴含着学习过程中学习规律与状态差异等信息,本文提出一种学习过程序列数据图像化的处理方法,进而提出基于卷积神经网络识别学习图像差异以预测学习成效的方法。它将学习者的学习过程序列数据转换为单通道或多通道学习图片,再基于卷积神经网络架构识别学习规律与状态的差异,进而预测学习成效。实验结果证实了该预测方法可以较准确地识别风险学生,并能较直观、准确地反馈学习者在学习过程中存在的问题与不足,以支持个性化教育干预的实施。最后,为了进一步提高学习成效预测模型对风险学生的识别精度,本文针对教育数据集的类别不平衡现状,分别从算法层面和数据层面提出了学习成效预测的优化改进算法及模型,包括(1)提出一种基于堆叠策略的两级增强集成算法,即次级模型融合了初级阶段不同预测模型的预测优势以实现最终的预测。实验结果证实了两级增强预测模型具有高的预测准确度、高的召回率,以及低的假阳性识别率。(2)提出了基于潜在特性变分自动编码的预测算法,即潜在特性变分自动编码方法通过学习风险学生的潜在特征分布,生成与真实风险学生类似的样本以改善训练数据的类别不平衡分布,再由深度神经网络进行最后的学习成效预测。实验结果表明所提出的采样方法相比于传统采样策略能更好地适用于教育情境,且基于该采样方法的整合预测框架具有高的预测准确度、高的召回率和较好的鲁棒性。