基于教育大数据的学生网瘾风险分析与识别

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:kikuL
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的迅速发展给人们生活带来了巨大的便利,但是,网络的过度使用和依赖会造成网络成瘾的风险。网瘾不仅会影响学生的学习生活,甚至会导致抑郁、自杀等更严重的后果。因此,提前发现网络成瘾的高风险人群,并在早期阶段及时进行干预治疗是非常有必要的。现阶段针对网瘾的检测方法大多使用心理学家的调查问卷,但是这种方法具有一定的局限性。目前,计算机领域多数研究使用朴素贝叶斯、逻辑回归等传统机器学习算法进行建模,而这些方法无法捕获数据中的时序信息。此外,在简单数据集上使用复杂模型容易导致过拟合问题。因此,本文建立了一种使用教育大数据中的时序信息来进行网瘾早期症状检测的个性化预警机制。具体的工作包括:(1)针对使用调查问卷的局限性问题,本文基于教育大数据,在五个不同的维度构建学生时序特征用于网瘾早期症状检测,并对网瘾高风险学生和网瘾低风险学生的差异性进行分析,能够提前发现网络成瘾的高风险人群,获取网瘾早期症状特点,提醒学校、家长及时关注这些学生,采取必要措施,降低网瘾带来的不良影响。(2)针对传统机器学习算法对时序信息捕获不充分的问题,本文构建了基于LSTM的预测模型,并添加Attention机制来增强重要特征对网瘾的影响,通过与基线模型对比和对时序特征进行消融实验分析,实验结果能够充分说明本模型的有效性,且能够较好的捕获数据中的时序特征。(3)针对在简单地数据集上使用复杂的模型带来的模型过拟合问题,本文提出gd-LSTM算法,利用dropout原理,使LSTM的三个门以一定的概率随机不发挥作用,以实现LSTM循环层正则化技术,来解决模型过拟合问题。实验结果表明了本方法的有效性,能够较好的解决过拟合问题。本文建立了一种自动化的检测网瘾早期症状的个性化预警机制,能够提醒学校、老师或家长及时采取必要措施以减少网瘾带来的危害。本文的工作还有助于发现网瘾出现的规律,从看似与网瘾无关的问题中提取出网瘾产生的因素。
其他文献
近年来,知识图谱在越来越多的领域上得以应用,而知识图谱的构建与完善需要多源知识的融入。不同的知识源对知识的定义有着各自的标准,因此在多源知识融合过程中,存在知识近似冗余或者知识冲突的问题。为消除这种矛盾和歧义,本文设计并完成了基于主动学习的知识融合系统。知识融合需要解决模式层融合和数据层融合两个问题。模式层定义了知识图谱的顶层结构,是图谱的元数据。因为这部分数据规模可控且非常重要,因此使用人工的方
通过时空众包,任务请求者将时空众包任务(与位置和时间相关的众包任务)提交给众包平台,众包服务器将任务分配给一组工作人员,工作人员将通过实际前往任务地点来执行任务。但是,当前的任务分配方案要求工作人员和任务请求者将他们的位置和任务的任务披露给不受信任的时空众包服务器,以有效地将任务分配给工作人员。但是这种信息披露或多或少会导致用户的隐私泄露。人们对于隐私泄露的担忧可能导致他们不愿参与到时空众包中。基
边缘计算作为一种缓解资源拥塞的策略,逐渐发展为满足物联网和本地计算需求的新范式。与传统云计算相比,边缘计算将大量的数据计算或存储迁移到网络边缘,可有效减少边缘或云服务器与用户间的传输延迟,避免网络中的流量高峰。但是,端边云设备自身的安全保障仍然是一个不可忽视的问题,端边设备大多是资源受限的设备,缺乏像云计算设备一样的保护措施,导致端边设备的防御性能更弱、被恶意设备攻击的可能性更高,其分布式特点使得
时间序列数据是指具有时序特征的特殊数据对象。一组序列是根据特定的时间间隔,进行一系列采样得到的数据。时间序列数据来源广泛,还具有数据量大、数据维度高、数据结构复杂等特点,这类数据与其他数据相比研究难度更大,也面临着更多的挑战。传统的时间序列特征提取方法通常需要人为设计特征,效率不高且有可能使特征丢失。近年来,基于深度学习的特征提取取得了优秀的成果,通过模型训练能够有效的提取特征,进而实现时间序列的
在生物医学领域,每天都会有大量的生物医学文献公开发表,而这些文献中蕴含着许多新的药物、疾病、症状之间的相互作用关系,是生物医学研究的重要资源。截至2021年2月,美国国立图书馆所设立的国际性综合生物医学信息书目数据库Medline中就已经有超过2700万篇以上的文献。从这些海量的生物医学文献中高效、准确地抽取出结构化的生物医学知识,对于加速生物医学相关领域的研究具有重要意义。当前,生物医学领域关系
在线课程的数量浩如烟海,对于学习者来说找到对自己最合适的好课程具有十分重要的意义。对于同一个技术的讲解课程,也会有很多资源供学习者选择,但是学习者很难在数量庞大的课程中选择到合适自己的课程。选择到合适自己的课程一般有两个方面的因素:一方面主动权在用户手里,用户通过课程信息和点评选择出课程,另一方面主动权在平台手中,平台通过丰富信息推荐给用户适合他的课程。所以一个深入挖掘评论用途的第三方的课程点评平
枳壳作为重要的中药材之一,是川渝、湖南、江西等地脱贫致富的重要经济作物。而枳壳病虫害的传染性和传播性严重威胁枳壳产品的产量和质量,极大地制约着乡村振兴。因此,枳壳病虫害的早发现、早治疗以及对乡村种植户病虫害防治知识与方法的普及至关重要。现阶段针对枳壳病虫害的图像识别研究仍然较少,依赖人工观察经验识别和管理病虫害效率低、准确率低。因此,基于枳壳病虫害识别算法的研究及智能识别系统的研发对于推进枳壳种植
随着互联网的快速发展,网络广告时代也随之而来。不同于传统的纸媒广告、电视媒体广告,网络广告具有可追踪的特性,所以企业对于量化广告投放效果的需求越来越强烈。但是,量化广告投放效果所需环节众多,企业开发一个功能齐全的软件需要付出巨大的人力成本,导致大部分企业尚不具备量化广告投放效果的能力。除此之外,网络广告的定价权在广告平台手中,对于企业客户,其广告花费不透明。所以,本系统的重心将放在量化广告投放效果
图像拼接技术对同一场景不同视点拍摄的一系列具有公共像素区域的图像实现配准与融合以生成一幅结构自然的高分辨率全景图像,在医学影像生成、全景摄影、智能驾驶、农业生产和林业监测上有着充分的应用。同时,图像拼接又是一项极具挑战性的任务,主要的难点可归为由拍摄视点变化导致的视差问题,以及在视点发生较多移动导致的宽基线问题。视差问题多产生匹配伪影,宽基线则由于匹配信息较少难以有效配准或造成非重叠区的形状失真。
本文以湖北省十堰市某供销社为试点,依托于科技部重点研发计划项目-绿色宜居村镇技术创新项目(2019YFD1101104),针对传统集中采购交易系统中存在的数据易篡改、数据可信程度低、难以处理大规模用户请求等问题,借助分布式思想、排队论和区块链技术设计开发了集中采购系统交易管理子系统,能够有效帮助农民依靠供销社等平台从网上集中采购生产生活物资,降低生产生活成本。首先,针对单个服务器无法处理大规模请求