论文部分内容阅读
互联网和教育,被誉为21世纪推动社会进步的两个“车轮”。在线学习作为“互联网+教育”的经典应用,正深刻影响着现有的教育观念和教育方法,基于网络资源的学习方式受到越来越多学习者的普遍关注,大量数字化学习资源在网络上不断涌现。但是网络学习资源多源异质、数据量大、知识组织结构松散,给大数据背景下的知识学习和知识互联带来了极大的挑战。知识图谱是一种结构化的语义知识库,采用图形化的方式描述知识资源及其载体,通过可视化的图谱展示知识的核心结构、发展历史、关联关系以及整体知识架构等。众包是一种基于互联网的新型社会化协作机制,它直接将问题发布到互联网上,充分利用广泛网络大众的群体智慧来产生超越个体智慧的成果,在许多领域中得到广泛应用。针对当前面临的问题,本文将知识图谱概念和众包技术相结合引入到在线学习领域,以知识图谱为载体,采用众包技术进行知识子图的获取和融合,搭建基于众包的教育知识图谱构建框架,实现“个体知识”构建和“群体知识”融合。本文主要工作如下:(1)定义知识图谱的形式化表示方法,并给出基于众包的知识图谱构建框架。该框架采用加权无向图结构来表示由知识点、知识关联、知识点权重和知识关联权重4类信息构成的知识图谱,主要包括知识子图获取、知识子图融合和知识图谱可视化3个模块。(2)提出基于众包的知识子图融合策略。该策略采用邻接矩阵形式表示知识子图,通过预处理去除重复、冗余和低频词汇,采用难度系数和学习者主观评价结果来量化知识点权重,采用知识关联出现频率和知识子图质量来量化知识关联权重,通过矩阵加权运算实现知识子图的融合。(3)给出众包模式下知识图谱的评价方法。该方法通过众包对知识点和知识子图进行学习者主观评价;将知识子图与群体知识图谱进行对比,根据知识子图的准确率、召回率和学习者主观评价结果等指标对知识子图质量和学习者能力进行量化和评价。(4)采用本文方法构建了IT行业软件开发领域的知识图谱,并在知识关联度方面,将本文方法与《知网》方法、人工标注数据集Words-240进行对比。实验表明,所提方法能够充分发挥“群体智慧”,具有较好实验效果,为教育领域知识图谱的构建提供一种新的思路。