基于本体知识库的教学资源自动采集技术研究

来源 :南京师范大学 | 被引量 : 17次 | 上传用户:qq68813172
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web信息资源已十分丰富,利用技术手段对Web上的教育资源进行自动采集,从而形成各种教学资源库,为教学活动提供信息资源服务,这无疑对促进教育信息化建设起到巨大的促进作用。但面对日益庞大的Web规模和越来越复杂的页面结构,研究如何在有限的网络资源和采集规模下,高效地从Internet采集教学资源,具有重要的学术意义和实践价值。本文对主题信息资源自动采集技术进行了系统研究,讨论了主题爬行技术、文本自动分类技术、文本自动抽取技术、本体及本体知识推理技术等,并深入讨论了这些技术在Web教学资源自动采集中的应用。本文以生态学的视角分析了Web主题资源的分布规律,提出了网络生态链(Network Ecological Chain)理论,并据此设计了网络生态链算法。提出了把网站的主题特性判断与具体的链接目标预测相结合的自上而下的主题信息资源采集方法:即通过网络生态链算法,辅以文本自动分类、文本自动抽取和本体知识推理等技术,首先从Web中发现主题网站群,然后结合网站、页面及链接邻近块文本的主题特性,再用主题爬行算法对具体的链接目标进行选择性采集。这样,可以有效地解决主题爬行中的方向迷失问题,提高主题信息资源采集的收获比(Harvest Rate)。为了提高主题爬行中对链接目标的预测能力,本文重点研究了本体(Ontology)技术及其在Web教学资源自动采集中的应用。讨论了本体语言、本体的构建方法及本体开发技术,尝试性地构建了教育本体知识库,开发了教育本体知识推理引擎,探索了教育本体知识推理引擎的具体应用。由于本体具有开放性和标准化的特点,因而教育本体知识库的构建可以通过共建共享的方式实现知识复用。最后,设计开发了一个Web教学资源自动采集原型系统,并以德育教学资源自动采集为例,验证了各种技术的有效性。本文的主要工作和创新之处主要有:系统研究了主题信息资源自动采集技术;提出了网络生态链理论,设计了网络生态链算法,并通过实验数据验证了其有效性;把本体技术应用于教育知识库的构建中,尝试性地开发了教育本体知识推理引擎,探索了它在Web教学资源自动采集中的应用。本文的研究可以为相关系统的设计开发提供了一定的理论指导和技术支持。
其他文献
美术教师应该努力挖掘美术学科的核心价值,优化教学目标,培养学生的美术素养,构建实效课堂。教师在教学中应巧用信息技术,激发学生的学习兴趣;设置问题情境,点燃学生的求知欲
目的阐述难治性心力衰竭的非药物治疗方法及其临床疗效,为临床治疗难治性心力衰竭提供临床治疗思路及参考。方法难治性或顽固性心力衰竭已成为影响患者生活质量的重要问题,目
随着我国经济的快速发展,城市化进程的不断加快,城市高层建筑数量在逐年递增。人们对建筑工程的施工质量要求也越来越高。剪力墙结构作为一种比较先进、科学的施工工艺,目前
随着经济的不断发展和社会的不断进步。越来越多的人开始关注中国的古建筑,对中国古建筑表现出了强烈的兴趣和喜爱。然而.在人们逐渐关注并喜欢中国古建筑的过程中.也出现了许多
在日常生活中,一些人在产生了自己难以解决的心理问题时,不寻求专业性心理帮助,以致使心理问题变得更加严重,这一问题已经引起了国内外不少学者的关注。他们运用各种问卷和访
目的本次研究主要是对应用传统放射与精确放射治疗技术治疗老年肿瘤患者的临床价值进行对比分析,进一步加深对老年肿瘤患者的治疗研究。方法选择我院2017年1月至2017年12月期
目的:研究CT灌注成像在鉴别诊断神经胶质细胞瘤与脑出血中的应用。方法:34例单纯脑出血患者与33例神经胶质细胞瘤卒中患者在入院24h内进行颅内CT检查,使用西门子公司提供的16层