【摘 要】
:
随着我国大学入学人数的逐年递增,高校教学质量受到了社会各界人士的广泛关注;而学业成绩作为衡量学生一段时间学习成效的重要指标,成为评价高校教育水准的重要指标之一。同时,各高校借着物联网、云计算和大数据迅猛发展的东风,纷纷建立了数字化校园环境。在此进程中,海量学生行为数据在校园内生成并不断积累。这些数据涵盖了学生日常学习和生活的全过程,不仅是研究人员当下关注的重点,也受到了高校管理人员的关注。但在实际
论文部分内容阅读
随着我国大学入学人数的逐年递增,高校教学质量受到了社会各界人士的广泛关注;而学业成绩作为衡量学生一段时间学习成效的重要指标,成为评价高校教育水准的重要指标之一。同时,各高校借着物联网、云计算和大数据迅猛发展的东风,纷纷建立了数字化校园环境。在此进程中,海量学生行为数据在校园内生成并不断积累。这些数据涵盖了学生日常学习和生活的全过程,不仅是研究人员当下关注的重点,也受到了高校管理人员的关注。但在实际应用中,受技术等因素的制约,绝大多数学业成绩预测相关研究往往只采用单一数据源进行,其预测精度往往不够理想,能为学生提供的反馈也较为有限。针对上述问题,本文基于校园大数据,在多空间数据融合的基础上(融合华师云课堂数据、校园一卡通数据、WiFi数据、校园网使用数据和数字教务数据),分析挖掘学生行为模式的变化,并运用机器学习算法构建多元分类模型,对学生的学业成绩进行预测,助力学生行为模型的优化和学业成绩的改善。首先,本研究提出了学业成绩预测模型,主要包括学业预测和预警反馈两部分。其中,就学业预测而言,包括:①行为感知与表征。在学号等敏感信息加密的基础上,汇聚并融合线上线下多维学生行为数据,构建多维行为的时间序列数据集。其中,汇聚线上云课堂等数据,计算学生线上学习频次及时长等基本信息和学生在论坛的情感概率及其随时间的变化情况;汇聚线下一卡通和WiFi等数据,计算学生的图书借阅、就餐、消费等校园行为及其随时间的变化情况;同时,提取多维行为之间的相互转移情况及其转移概率,以量化学生行为的规律性(例如:学生甲吃完早餐后去图书馆的行为转移概率)。②特征计算。基于时间序列数据集,构建行为序列的量化计算表征模型,该模型从四个方面对行为的变化进行计算。首先,采用线性回归分析,利用线性指标(拐点、斜率、残差等)量化学生行为的线性变化特征;利用非线性指标(含:HMM熵、李氏指数、赫斯特指数、去趋势波动分析等)量化学生行为的非线性变化特征;采用深度学习算法,利用长短期记忆模型(LSTM)提取学生行为的时序变化特征。进一步地,为了综合考量不同类型行为指标对学业成绩的影响,本研究从加权融合的角度入手,计算各类指标的“加权特征”,对多维行为特征进行系统量化和分析。实验结果表明:本文所提取的行为表征模型能够较好地刻画学生的行为模式及其变化情况。③智能预测。采用相关性分析等方法,筛选对学业成绩影响较大的特征,在特征选择的基础上,采用XGBoost、SVM、KNN、GBRT以及RF等经典机器学习算法构建预测模型,并对比各经典算法的预测性能。研究发现:无论是在单源大样本数据集还是在在多源小样本数据集上,各预测算法均具有良好的预测性能,其分类预测准确率均达到0.80。就预警反馈而言,本研究使用95%置信区间箱体图,从学生行为模式的线性、非线性、时序和加权平均角度出发,对其行为模式与学业成绩之间的关系进行可视化分析和预警。实验结果表明,箱体图相关特征可以准确区分不同成绩区间的学生。其次,实验验证。本研究在两个真实数据集上验证了所提框架的有效性:①聚焦学生个体的行为差异,基于多源校园数据构建学业成绩预测模型(多源小样本):模型在多空间数据融合的基础上,在相对小的样本上(156人),可以较为准确地预测学业成绩,其预测准确率均达到0.84以上,同时为有挂科风险的学生个体提供可视化的学业成绩预警;②聚焦文理科群体的行为差异,基于上网行为数据构建学业成绩预测模型(单源大样本):模型在单一数据源(校园网使用数据)的基础上,在相对大的样本上(999人),以0.80准确率进行学业成绩预测,同时为有挂科风险的文理科群体提供学业成绩预警及对比。总之,本研究建立的模型无论是在多源小样本还是单源大样本数据集上,均能够较好地区分学生是否存在挂科风险,其预测准确率均达到80%以上。此外,研究发现,对于不同文理背景的学生而言,相同的上网行为对不同群体学生学业成绩存在不同的影响。
其他文献
小学生编程教育对国家未来科技主导权具有极其重要影响,现已经上升到了国家战略层次。目前针对小学生编程教育平台的应用虽然有了一定的进展,但实际教学中仍存在硬件可编程性较差、设备实用性不足、编程教学案例乏味等问题。针对以上问题,采用SOM-RK3399核心板作为主控设备,集成语音处理模块、STM32控制模块等,设计并实现了一种面向小学生编程教育的嵌入式开发平台,具有研究意义与应用价值。主要研究内容如下:
课程思政与专业教育有效融合是实现立德树人的重要手段。基于“视觉设计”课程的特点,从爱国情怀、中华文化传承创新、科学思维方法、工匠精神、职业素养等方面挖掘课程思政要素,修订课程标准,优化课程思政教学内容及目标,梳理思想政治教育融入点,以期推动“视觉设计”课程思政建设取得显著成效。
文档与查询之间的语义鸿沟是信息检索领域中一个挑战性的难题。伪相关反馈是解决这个问题的一个可行的办法。由于自然语言的复杂性,传统的伪相关反馈方法很难准确判断查询与扩展项之间的语义相关度,因此这种方法不可避免地会引入一些噪音。预训练模型BERT在很多自然语言处理任务上取得了里程碑式的突破,其中Nogueira等人在MS MARCO段落检索任务上,利用BERT模型将检索精度提升了 27%左右。相对于传统
智能交通系统可以监控道路状况,是当今交通发展的必然方向。而车辆检测在智能交通系统中有着重要作用,它可以检测车流量,从而为道路交通状况提供各种重要数据。由于航拍图像的背景环境比较复杂,目标比较小且数量较多,遮挡问题比较严重,给航拍车辆的检测带来了困难,所以如何在复杂的环境下提高车辆检测的精确度具有现实的意义。YOLOv4算法代表着目前业界最先进的物体检测水平,它的检测速度超过其他检测系统,实现了速度
目前,知识图谱已广泛应用于各个领域,在教育领域的应用和成就尤为显著,知识图谱在教育教学中扮演着越来越重要的角色。编程学习作为教育领域的一个重要分支,对于初学者来说,却仍存在诸多挑战,如学习周期普遍较长、缺乏有效的学习辅助手段并且在编程实践中难以及时的获得帮助等。这些挑战给编程初学者带来极大的不便,对于其知识的掌握和能力的提升都是不利的。基于上述内容,本文在分析编程语言学科特点的基础上,围绕着编程语
计算机信息技术发展日新月异,其开发应用百花齐放,深入各行各业。计算机视觉技术对图像和视频的处理水平也日趋成熟,尤其是人脸检测和识别技术发展迅猛,在人机交互、身份验证和视频安防等领域均有一定的研究成果。卷积神经网络是深度学习的代表算法,因其良好的鲁棒性和较高的准确率,广泛应用在目标检测和模式识别领域,逐渐成为工程应用的主流选择。人机交互技术使人与机器建立连接,实现机器为人提供更加优质的服务。这些技术
伴随着互联网的发展和普及,以MOOC为代表的在线学习已成为一种新型的学习方式。在新冠肺炎疫情期间实施的“停课不停学”活动,进一步推动了 MOOC学习的应用广度和深度。虽然MOOC学习具有不受时间空间限制、受众门槛低、学习资源丰富等优势,但也存在学习者被淹没在海量的资源中、难以找到符合自身需求的学习资源以及退课率高等诸多问题,所以如何为在线学习者提供个性化的资源服务是当前在线学习领域亟需解决的问题。
从工程领域到经济学领域,大量问题都存在多个需要优化的目标,而且各个目标之间相互制约、彼此冲突,此类问题被称为多目标优化问题(Multiobjective Optimization Problem,MOP)。与传统数学方法相比,进化多目标优化算法(Evolutionary Multiobjective Optimization Algorithm,EMOA)不需要了解问题的数学特性,而且在一次运行中
随着“互联网+”教育和智能技术的不断融合,智慧课堂场景下的多屏多点触控教学模式应运而生,教学内容及教学活动表现形式将更加丰富多彩。然而,以教师为主体的填鸭式教学模式将不适用于新时代背景下的师生互动关系,不利于教学效果的提升。为引导学生成为教学活动中的主体,掌握教学过程中的学生学习状态、感兴趣情况是非常有必要的。课堂学生注意力将能够客观真实地反映教学活动中学生的兴趣热点、知识盲区以及积极状态,是提高
单细胞RNA测序(scRNA-seq)技术是研究基因与表型之间的关系的利器,同时也是当前生物医学研究中最重要的技术之一。然而多种因素导致单细胞RNA测序数据中存在噪声,如Dropout现象等。这些噪声可能会阻碍单细胞测序的部分下游分析问题。为此研究人员提出多种计算方法用以填充或补全单细胞测序数据,以减少数据噪声。单细胞RNA测序数据会因为Dropout现象等原因导致测序数据矩阵具有极高的稀疏性,针