知识抽取系统中学术概念属性的抽取

来源 :中国科学技术信息研究所 | 被引量 : 0次 | 上传用户:yummyumi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
学术文献是科研成果的结晶,蕴含着丰富的知识和智慧,面对当前知识爆炸,人们需要对其进行有效的组织和管理。知识抽取是对学术文献中知识点进行抽取,以格式化的形式存入知识库,是对文本知识组织的一种新的方式,属性抽取作为知识抽取的一种应用,是将不同文献中对于某一学术概念的属性集中起来,有助于全面地了解这些学术概念。本文通过对国内外属性抽取的研究热点、对象、方法和结果评测等方面进行综述分析,发现从学术文献中进行抽取非常具有价值,是文献处理的一种潜在发展趋势。   本文对知识抽取系统中学术概念属性的抽取进行了研究,首先对抽取规则的形成方法进行了探讨,提出一套学术概念属性规则的构建流程,并通过大量的文献阅读和分析,人工构建了属性抽取的九大类的抽取规则,还对属性描述的数量关系和情感信息进行了讨论;然后对知识抽取系统中属性抽取系统进行了设计,确定了一套属性抽取的流程,并对系统中文献内容解析模块、文本预处理模块、规则构建模块和属性抽取模块这四个关键模块的进行了具体阐述;最后对属性抽取系统进行了实现,并把机器抽取的结果和人工标记的结果进行了结果测评,还对结果进行了分析,找出当前研究的不足和下一步工作的方向。   本文的创新点是采取知识单元的方式从学术文献中抽取知识点,并对属性描述进行了数量关系和情感信息方面的分析。本文通过《情报理论与实践》2009年的387篇全文进行阅读分析来构建抽取规则,并选取《情报学报》2007年140篇和2008年的113篇全文进行了实验,规则来源与实验数据选择不同期刊,说明规则具有一定的适应性;本文还对机器抽取结果和第三方人工标记结果进行了测评分析,为进一步的深入研究奠定了基础。
其他文献
针对石油化工行业排放的恶臭硫醇和苯、甲苯、乙苯及二甲苯(benzene,toluene,ethyl benzene and xylenen,BTEX)污染物,采用生物法对其进行去除.在生物滴滤塔(biotrickling fi
[目的 /意义]考察韩国图书情报学教育历史,有利于把握其发展特点和建设规律。[方法 /过程]通过阅读国内外与韩国图书情报教育相关的文献,凝练出韩国图书情报教育的发展规律,
[目的/意义]信息时代对新老“图书馆五定律”关系进行系统思考和研究,具有较强的理论价值和实践指导意义.[方法/过程]利用文献调研法和比较分析法,在两个定律基本内容解析的
[目的 /意义]目前我国的学术出版素养教育尚处于起步阶段,缺乏一定的实践基础,亟需借鉴和学习国外高校图书馆在学术出版素养教育方面的经验,以期为我国高校学术出版素养教育
[目的 /意义]数据库建设是智库发展的重要基础,通过调研国内高校智库数据库建设的现状和存在问题,为高校图书馆开展相关服务提供现实依据和参考。[方法 /过程]基于中国智库索
机构知识库(Institutional Repository,简称IR)是在以开放获取和数字化科研为主流的学术环境下,为改变传统学术交流模式的弊端而产生的。基于开放获取理念依托于学术研究机构
随着数字技术与互联网的飞速发展,数字能力已经成为人类生存与发展的基本技能之一,并日渐受到人们的重视。人们对数字能力的研究也逐渐增多、逐渐深入。然而,数字能力作为高等教
学术活动的两种基本类型是学院学术与应用学术,在学术运行系统中二者间是连为一体、互促共生的关系.认为专业学位研究生教育面向应用学术而生,具有当然的应用学术性,其体现是