论文部分内容阅读
教育数据挖掘(Educational Data Mining)是研究教育教学中产生的数据,挖掘数据潜在的价值反作用于教学实践中。教学改革伴随时间的推移不断深化,许多高校将学生评教活动作为评估教师教学质量的重要形式和方法之一。目前高校普遍存在评教系统,系统中的数据包括评分和评语。大多数高校对评教系统的利用不够充分,没有充分挖掘评教系统中的信息,评教系统的设计没有参考学生的意见。多数高校对评分数据只是进行简单的统计计算,没有挖掘学生的评分模式。对学生写的评语数据没有经过系统的处理,都是通过任课教师自己阅读。繁重的工作量导致教师和教育管理者对评教系统失去耐心,对评语没有认真去解析,没有抓住学生的需求,评教系统没有真正为教学质量的提升贡献足够的力量。本文的研究主要从两个方面入手:(1)矩阵分解和非负矩阵分解评分数据。首先对学生的评分模式进行可视化,然后对学生的评分模式进行分类,去除对评教工作没有意义的数据,然后使用矩阵分解算法分解评分数据,对矩阵分解算法进行改进,提高了算法的预测效果。但分解矩阵过程中存在负值,而负值对评教工作来说是毫无意义的。为了保障分解矩阵中的元素都有意义,作者引入非负矩阵分解,该算法思想和矩阵分解大致相同,只是限制分解矩阵中元素的非负性。该算法保障了分解矩阵的非负性,使得分解矩阵结果具有可解释性,非负矩阵分解学生评教数据,得到的结果与实际评教数据之间的均方误差为2.96。(2)对评教文本数据的研究,使用自然语言处理技术挖掘文本中的情感信息。处理评语数据首先对每条评语进行分词,然后对分词的结果进行词性标注,接着使用句法分析解析评语中词汇之间的关系。使用OP(Opinion Parser)提取算法提取评语中的方面词和方面情感词。提取出的方面词对通过词向量模型和余弦相似性映射到教育工作者和教师最为关系的六个维度上,并计算学生对教师的评价在每个维度上的具体得分。其中使用OP提取算法的精准率是81.14%,召回率是82.28%。使用词向量模型和余弦相似性算法将方面词映射到六个维度的准确率为82%,作者对词向量映射的改进使准确率提升了7%。使用知网词典对提取出来的情感词极性分类,准确率为94.12%。最后预测学生对教师在多个维度上的评价。预测学生对教师的评价,可以帮助高校管理者更好地了解教师,使教师更了解自身的优缺点,改进教学,促使教学进展更顺利,提升高校的教学质量。