高校学生学业表现数据建模研究

来源 :南京师范大学 | 被引量 : 8次 | 上传用户:sbtlan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高校教育数据挖掘是对高等学校大规模全样本教育数据的挖掘和分析的技术手段,具有能够辅助高校决策能力、管理效率和教学效果提升的高校治理价值。基于教育数据挖掘的技术手段,构建高校学生学业表现的数据模型,挖掘和利用高校教育数据的价值,有助于丰富学生发展理论和完善高校学生管理和学业支持体系。高校学生学业表现的研究具有可靠的实证研究的理论基础。本研究吸收了国内外关于高校学生学业表现的理论框架包括戴维·拉文的学业表现影响因素分析框架、阿斯廷的学生投入理论与I-E-O模型、乔治·库的学生投入理论与大学生成功要素模型,以及NSSE、CCSS、NCSS等调查研究方案的成果,构建出学校环境、社会及人口统计特征、学生个人特征、学生投入等四维度的高校学生学业表现影响因素分析框架。基于这个分析框架,对个案高校学生学业表现进行系统化的数据分析和数据挖掘,以揭示个案高校教育数据系统所存在的问题以及个案高校学生学业表现上所存在的问题。本研究采取个案研究的方法,重点在于揭示个案高校学生学业表现的独特情况和问题,但通过个案的分析,也有助于认识和分析具有普遍意义的高校学生学业表现的共同问题。本研究构建了整合型教育数据系统,采集教学管理信息系统数据以及学生学业表现的关联数据,进行数据的清洗、存储;运用描述性统计方法、方差分析方法分析学生学业表现的特征及差异性;分别从教学管理信息系统数据、整合型教育数据系统中的客观数据、整合型教育数据系统中的全部数据三种数据来源,从社会及人口统计特征、个人特征、学生投入等三个维度,运用多元线性回归、二元逻辑回归等传统统计方法构建回归模型,贝叶斯网络、决策树、人工神经网络、支持向量机等教育数据挖掘方法构建分类模型,并比较各模型有效性,提出高校学生学业表现预测模型的部署模式。研究结果显示,从社会及人口统计特征维度,学生学业表现存在性别差异、地区差异、民族差异。父母教育水平的不同不会带来学生学业表现的差异。从个人特征维度,学生学业表现也存在着科类差异;高考成绩与学生学业表现间存在一定的正相关;人格、学业自我效能、心理状态、体质测试、心理预警状态、学生干部和党员身份与学生学业表现都存在相关性。从学生投入维度,参加学术讲座、志愿服务、社团和利用图书馆资源与学生学业表现之间都存在着显著的正相关。就读体验与学生学业表现存在负相关。学业目标与学生学业表现呈正相关。通过对所构建的回归、分类共27个数据模型的比较发现,基于整合型教育系统中全部数据构建的模型最为有效。多元线性回归模型最高可解释学生学业表现65.4%的变异量;社会及人口统计特征维度变量的解释力约在13%到18%之间,个人特征维度变量的解释力在7%到20%之间,学生投入维度变量的解释力在10%到17%之间。二元逻辑回归模型最高预测正确率为69%。应用贝叶斯网络、决策树、人工神经网络、支持向量机等教育数据挖掘算法建立的12个分类模型,在运行时间、预测正确率、灵敏度等方面都存在差异。相对而言,贝叶斯网络分类模型和支持向量机分类模型的预测有效性要高于决策树分类模型和人工神经网络分类模型,贝叶斯网络分类模型的稳定性要高于支持向量机分类模型。通过自变量精简减少了 10个自变量,且未明显降低模型有效性。
其他文献
<正>基础研究是国家的重要战略资源,是现代科学技术发现的基础和源泉,是培养科技人才,提高创新能力的关键所在。世界强国都在通过加强基础研究来提高本国的综合科技实力。
中国社会工作经过十年的快速发展后,已进入职业化和专业化发展的关键阶段。在这一阶段服务的专业化成为最为突出、也最受人们关注的焦点问题之一。特别在社区领域,社会工作者
随着市场竞争的加剧,多品种小批量的生产模式得到越来越多的青睐,一种新的柔性作业车间应运而生。柔性作业车间调度问题由于其柔性的特点成为最困难的组合优化问题之一,因此
帕金森病是老年人神经系统变性疾病之一,也是老年人最常见的锥体外系疾病,以黑质多巴胺能神经元变性、缺失以及路易小体形成为其主要病理特征。其临床症状主要包括运动症状及
城市道路绿化,是城市园林绿地系统的重要组成部分,它是城市文明的主要标志之一。街道绿化搞好了,不仅美化了街景,而且还有净化空气、防风、防火、保护路面、组织城市交通、维
一种持久确立的社会秩序是建立在秩序的可接受性的基础之上的。哈贝马斯吸收借鉴康德的实践理性与韦伯的工具合理性,博采众家之长,建构了自身的交往合理性理论。理性的商谈论
本文采用录像观察法、文献资料法、数理统计法、逻辑分析法,对中国优秀女子乒乓球运动员丁宁十五场比赛和刘诗雯十五场比赛进行全面的技战术统计与分析,通过研究表明得出以下结论:1.从发抢可以看出,丁宁和刘诗雯主要都是以短球为主,结合半出台和底线,短球可以降低对方运动员接发球抢攻的机会,为自己第三板抢攻做铺垫;半出台可以降低对方运动员上手质量,为第三板反拉进攻做准备;底线尤其是急长球,可以起到偷袭对方的效果
研究压榨法、石油醚浸提法、超声波水代法、水酶法、超临界CO2萃取5种方法对茶油提取率、感官品质、理化指标和脂肪酸组成等的影响。结果表明:超临界CO2萃取法的提取率最高,
水稻高产栽培是一个复杂的综合技术体系,受到栽培区环境、品种选择、栽培措施等因素的影响。本文总结了水稻品种沈农129的育秧技术,以及在充分利用当地气候、土壤条件下,采取