论文部分内容阅读
慕课作为一种全新的在线学习方式,因其开放性、碎片化的课程组织形式、互动性等特点,自诞生后备受国内外教育机构与广大学习者关注。研究者们基于慕课在数据挖掘、自然语言处理、信息检索等领域开展了各方面的研究,如基于慕课平台的教育数据挖掘、学习行为分析等。当前,慕课研究的一个重要方向是满足学习者的个性化服务需求,而个性化服务中的一个关键问题在于如何对慕课中的学习者进行兴趣建模。慕课中的学习者兴趣模型能否准确、实时地反映学习者的兴趣、偏好情况,是慕课提供个性化服务的核心和基础,直接影响着慕课个性化服务的效果和质量。本文主要关注慕课环境下学习者兴趣模型的建模技术和方法,主要的研究成果包括:(1)综合构建了慕课环境下学习者兴趣模型,即(S,C,T)三元组。其中,S表示学科兴趣类集合,C表示课程兴趣类集合,T表示主题兴趣类集合。该模型能在一定程度上反映学习者在慕课平台上的学习兴趣。(2)通过兴趣广度和兴趣强度两个指标对学习者的兴趣进行量化,从学科、课程、主题三个维度分别对学习者的兴趣广度、兴趣强度进行计算。其中,依据慕课网站对课程所属学科类别的划分,学科层次的学习者兴趣广度获取来自于学习者课程所属学科的统计情况;计算各个学科类别的占比,即可得到学科层次的兴趣强度值。课程层次的学习者兴趣广度获取来自于学习者获得课程证书、课程评论中涉及的具体课程;而兴趣强度的计算则利用多元线性回归方法,通过学习证书、评论数量两个指标建立的线性回归方程得出课程层次的兴趣强度值。主题层次的兴趣广度获取来自TF-IDF算法提取课程评论下的关键词,对关键词的语义相似度进行夹角余弦值计算,利用聚类得到不同的主题词;兴趣强度的计算则是提取的关键词及其权重来表示。最后,本文对构建的兴趣模型进行了实例分析。本文选取了中国大学慕课网的学习者作为研究对象,抓取了 21名学习者主页的显式信息数据,即课程数量、学习证书、课程评论等信息,基于此数据从学科、课程、主题三个维度构建了学习者兴趣模型。通过对学习者兴趣模型可视化的分析,表明该模型能够比较全面地展示学习者的“学科—课程—主题”兴趣集,为慕课进行后续的个性化服务打下了良好的基础。