【摘 要】
:
时至今日,校园的信息化与数字化建设已经初具成效,各大高校已经基本上建设起了较为完善的“智慧校园”。“智慧校园”的建设也为教育数据挖掘的发展提供了良好的环境。如果能通过教育数据挖掘分析出学生在行为等方面的特点,毫无疑问将能够对学校各方面的管理方案的制定提供有重要意义的参考。研究表明,自我控制能力对于个人发展而言至关重要。目前对自我控制能力的衡量主要是使用传统的调查问卷方式,然而调查问卷方式具有低效等缺点,教育数据挖掘的发展为其带来了全新的机遇。因此,本文提出了基于校园大数据的学生自我控制能力分析模型,该模型
论文部分内容阅读
时至今日,校园的信息化与数字化建设已经初具成效,各大高校已经基本上建设起了较为完善的“智慧校园”。“智慧校园”的建设也为教育数据挖掘的发展提供了良好的环境。如果能通过教育数据挖掘分析出学生在行为等方面的特点,毫无疑问将能够对学校各方面的管理方案的制定提供有重要意义的参考。研究表明,自我控制能力对于个人发展而言至关重要。目前对自我控制能力的衡量主要是使用传统的调查问卷方式,然而调查问卷方式具有低效等缺点,教育数据挖掘的发展为其带来了全新的机遇。因此,本文提出了基于校园大数据的学生自我控制能力分析模型,该模型结合了数据挖掘以及机器学习技术,从学生在校期间日常生活产生的数据中挖掘其与自我控制能力相关的特征并构建算法模型,实现了对学生自我控制能力的分析。本文的主要工作如下:
①提出了基于多因素的自我控制能力分析算法模型,研究了学生自我控制能力与行为数据之间的相关性,通过校园多源数据构建出与自我控制能力相关联的特征向量,所采用的数据考虑了学生在校的多种日常行为,包括学生在校的历史成绩数据、上网产生的网络日志数据、使用一卡通产生的消费数据和进出宿舍的门禁数据,多方面对学生进行立体的分析。提取了消费特征、门禁特征、健康习惯特征以及学习能力特征。结合学生自我控制量表测评数据,使用不同算法进行实验,实验结果表明,使用XGBoost在学生自我控制能力分析问题上的预测水平最佳,F1-score达到0.71。
②为了对学生的整体行为进行描述,提出了行为链的概念,将校园中的多源异构数据进行融合。在此基础之上,对学生的整体行为模式进行分析。使用隐马尔可夫模型对学生的行为进行建模,提取了学生行为模式特征。提出基于周期相似性度量方法,提取学生行为周期相似性特征。根据学生行为数据挖掘出学生的人际关系,从而提取学生的人际关系特征。最终的算法模型的F1-score达到0.77。
综合以上实验表明学生的自我控制能力与在校行为数据之间存在关联性,可以通过校园大数据分析学生的自我控制能力。随着学生在校时间的增长,所产生的日常行为数据会不断增多,可以实时地捕捉到学生自我控制能力的变化,便于学校及时采取相关措施,对自我控制能力弱的学生进行引导。
其他文献
随着互联网信息技术的发展,大规模数据的采集越来越便捷,数据的结构也越来越复杂,对大量复杂的数据集进行类别标注非常困难,如何从复杂无标签的数据中挖掘出有价值的信息成为无监督学习的研究重点。聚类分析和离群检测分析是无监督学习领域中非常重要的两个研究方向,并且有着十分广泛的应用,如图像分割、人脸识别、信用欺诈检测和网络入侵检测等领域。
密度核心这一概念的提出,使得聚类算法在处理复杂形状和多密度层次的数据集时表现出很强的优越性。DCore算法是基于密度核心的聚类算法中最具有代表性的一个算法,但是DCor
为加强全区农村土地承包经营权确权登记颁证档案规范化管理,推进工作进度,近日,广西壮族自治区档案局馆在藤县召开全区农村土地承包经营权确权登记颁证档案业务推进会,自治区档案局馆副局馆长农民智出席会议并讲话。 农民智介绍了全区承包地确权档案工作的开展情况,指出了存在的问题,并对下一步全面推进承包地确权档案工作进行部署。他要求各级档案部门明确职责、落实责任,扎实做好辖区内承包地确权档案的业务指导和示范点
【摘要】在对高水位场地进行深基坑设计和施工往往会受到相关因素的影响,因为降水开挖会导致局部水文地质条件发生变化,并且这和支护结构和周边环境之间是相互制约的关系。本文对基坑止水帷幕分为三种嵌固模式,每种模式的渗流变化特征和支护结构及地面变形的影响程度进行了讨论,希望具有借鉴意义。 【关键词】支护结构;受力;地面变形;基坑开挖;降水影响 一、引言 基坑受到降水和土体开挖的影响,其原始地层水上平衡
近日,四川省档案局印发《关于加强汛期档案安全工作的通知》,提前谋划部署全省汛期档案安全工作。 文件要求牢固树立灾害风险管理和综合减灾理念,强化担当意识和底线意识,坚持“安全第一、预防为主”的档案安全工作方针,主动作为、提早谋划、提前部署,切实把汛期各項档案安全措施落实到位;加强组织领导,建立健全汛期档案安全工作领导小组,确保安全防范工作指挥到位、职责明确、措施有效;开展档案库房、业务技术用房等重
6月8日,据山东省政府新闻办召开的新闻发布会消息,山东在全国率先出台《山东省人口健康信息化建设“十三五”规划》。目前全民健康信息基本实现互联互通,省级平台与17个市平台、131个县(市、区)、95家三级医院、132家二级医院、3548家基层医疗卫生机构对接,基本实现全员人口信息实时采集、居民电子健康档案动态更新,医院电子病历摘要数据实时上传。 山东建成基础资源、全员人口、电子健康档案、电子病历四
【摘要】就当前的现状来看,日语语言文化在传承过程中逐渐呈现出暧昧特征,且在暧昧特征显现过程中倡导“以心传心”,为此,在日语交际过程中应提高对此问题的重视程度,且为了规避语言交际过程中,冲突表达问题的凸显,应注重强调对日语语言的深入探究,即结合日语语言表达中不确定性表达、一词多义表达等多种表达方式,对自身观点自身传达。本文从日语暧昧性表达方式分析入手,并详细阐述了日语暧昧性表达方式产生的原因。 【
点云是通过对物体表面采样得到的散点集合,常用于三维模型的表面重建。对于树木这样有大量小分支的物体,传统的表面重建算法往往效果不理想。常见的做法是先提取树木点云的骨架线,再基于骨架线辅助网格模型重建。除了辅助重建,点云骨架线还可用于生成模型骨骼动画、物体拓扑分析等。因此提取点云的骨架线具有重要的研究价值。提取点云骨架线的挑战主要在于:点云存在一定的噪声数据;点云经常因为遮挡效应导致部分数据缺失;点云的密度经常是不均匀的。这些问题使得点云的拓扑信息的提取变得困难。为了提取更准确的点云骨架线,本文做了如下工作:
【摘要】帕默爾(1983)说:对意义的变迁作出纯逻辑分类是徒劳无功的,因为两种或更多不同过程可以得到完全相同的语义结果。发现决定意义变迁的动力和条件才是有兴趣的。Lightfoot把人类心里的因素看作是引起语义变化的诱引之一(转自张旺熹2006),下面我们就从认知经济性的角度浅谈系词“是”的来源问题。 【关键词】认知经济性;系词“是”;来源 一.简述系词“是”产生的时代 关于系词“是”产生的
分布式约束优化问题(DCOP)是多智能体系统(MAS)领域中的一个基本框架,可对多智能体协作优化问题进行建模,已成功应用于任务调度、资源分配等问题中。目前,求解DCOP的非完备算法大都采用单解优化思想,并且普遍存在过早收敛、解的质量差等问题。针对上述问题,本文致力于研究利用基于种群进化的遗传算法来提高DCOP的求解质量。具体研究内容如下:
①针对现有基于局部搜索的DCOP求解算法易陷入局部最优,提出一个基于遗传算法的局部搜索算法框架(LSGA)。通过分析遗传算法和基于局部搜索的DCOP求解算法的
计算机视觉、机器学习、图像处理等领域都会涉及到分类问题。所谓分类就是将相似的对象分为一组,将不相似的对象分到不同的组。分类问题面对的对象通常都是高维数据,高维数据往往会给计算带来内存占用高、计算时间长的问题,并且还会因“维数灾难”导致算法有效性降低。为了解决这一问题,可以利用到稀疏表示。所谓稀疏表示就是为普通稠密表达的样本找到合适的字典,将样本转化为合适的稀疏表达形式,从而使学习任务得以简化,模型复杂度得以降低。本文基于稀疏表示提出了一种图像聚类算法,稀疏卷积子空间聚类,以及一种可以应用于图像分类的单图的