通用本体学习方法及其应用的关键技术研究

被引量 : 0次 | 上传用户:dna_cc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的发展和社会信息化程度的不断提高,人们在工作、学习、生活等各方面对信息系统的智能化和知识化的需求日益增加,使得数据的表示不仅仅停留在语法层面,更需要聚焦在语义层面。本体作为一种能够在语义知识层面上描述数据与信息的概念模型,为解决语义层面的理解与沟通的问题提供了有效的途径。目前,本体构建存在两种方式:一种方式是通过本体构建工具进行手工构建本体;另一种方式是通过本体学习方法进行自动或半自动构建本体。随着网络大数据时代到来,通过本体学习方法构建本体的方式日益重要。现有的本体学习方法基本上是根据不同数据源类型决定采用不同的本体学习方法。然而,面对互联网上复杂的数据源中庞大的数据信息,如何从复杂、异构的数据源中采用通用的本体学习方法,构建与丰富本体知识,从而提高本体学习的适应性和自动化程度是现在需要解决的问题。针对上述问题,本文模拟人类学习思维方式,提出基于粒计算的通用本体学习体系框架和学习方法。该框架是基于明确的本体学习任务层次,自下而上进行本体的概念、分类关系、术语、非分类关系和规则的学习。同时,该方法是从领域具体实例对象集合中抽取概念和分类关系,从而构建本体的概念粒度空间,为本体学习的后续任务提供了一定基础;由于将前期异构的数据源中抽取的数据,预处理为本体学习的信息输入系统,所以在本体学习方法的通用性上有了较大的提高。本文将所提出的本体学习方法应用于人物领域的本体学习中,从而可以得到人物领域本体;同时,将人物领域本体与搜索引擎相结合,不仅可以提高人物信息搜索的准确性,而且可以验证人物领域本体的正确性和本体学习方法的有效性。本文对通用的本体学习方法及其应用的关键技术进行研究和探讨,主要内容总结为以下五个方面:●本文深入分析了本体学习的研究现状和存在的问题,提出了通用的本体学习体系框架。本文分别从本体的组织结构和本体学习的数据源复杂性、异构性的角度进行分析,阐述了本体的定义、分类、本体学习的任务和同构化的本体学习信息输入系统。根据信息输入系统中数据的特点和人类学习的思维方式,提出了通用的本体学习体系框架。针对本体学习体系框架中学习的任务层次,提出了相应的本体学习方法,为后续本体学习研究提供了基础。●针对无初始本体的本体学习的需求,提出了本体的概念粒度空间模型和构建本体的概念粒度空间的算法。本文描述了领域具体实例对象粒和抽象概念粒粗糙集的表示及粒化方法、本体的概念粒之间的关系和运算、领域具体实例对象粒的粗相似表示方法,同时针对领域具体实例对象粒和抽象概念粒的不同特性,提出了构建第一层抽象概念粒度空间和多层抽象概念粒度空间的算法,并通过实验验证了算法的有效性,提高了本体的概念和分类关系学习的准确性。●针对有初始本体或概念粒度空间的本体学习的需求,提出了基于HowNet的概念语义相似度的改进算法。本文围绕如何进行本体的概念或术语学习的问题,深入分析了国内外已有的概念语义相似度算法,总结归纳了影响概念语义相似度算法准确性的主要因素,结合中文知识库HowNet和同义词林的内容组织结构特点,改进已有的基于HowNet语义相似度算法。该算法综合考虑了多种影响语义相似度值准确性的因素,与其它语义相似度算法相比,实验结果显示概念语义相似度的准确性有了很大提高,进而提高了本体的概念或术语学习的准确性。●本文将所提出的本体学习方法应用于人物领域本体学习中,设计与实现了人物领域本体学习系统,从而得到了人物领域本体。在人物领域本体学习过程中,为了降低构建概念粒度空间算法的时间复杂度和信息输入系统的属性特征的维度,本文提出了基于向量空间模型的KNN-DAG-SVMs分类算法,并通过实验验证了该算法的有效性,与其它分类算法相比,在准确率和召回率方面有了明显的提高。●本文将学习得到的人物领域本体应用于搜索领域,提出了基于人物领域本体的智能搜索体系框架,并且描述了框架中各个模块的功能;为了提高搜索的速度,在数据索引模块中,提出了三级倒排索引模型;同时在本体学习模块中,提出了新增具体实例对象的学习算法,实现了基于人物领域本体的智能搜索系统。该系统不仅提高了人物信息搜索结果的查准率和查全率,而且进一步丰富了人物领域本体的具体实例。实验结果表明,基于人物领域本体的智能搜索与其它搜索相比具有一定的优越性。
其他文献
通过对900亩云南重楼林下种植案例的成本、流动资金、固定资产折旧、无形资产和其它资产摊销、借款还本付息、产量预测、销售收入、销售税金、利润分配及现金流量分析,探索在
有特色有优势没有资金做宣传后盾?我们可以靠小成本创业,以特色制胜。市场本身就是竞争的,同质性强,没有特点肯定很难立足,只有有特色、有区别才能在激烈的竞争中树立优势、
1 病例资料1.1 现病史 患儿张某,男,8a,汉族,家住云南省思茅市。因不停地动、孤僻不语、发笑、不知危险6a。于2006年6月入院。2a前生长发育正常。其母亲工作忙;其父没工作,嗜酒,常醉
2009年1月1日起,我国实行消费型增值税,目前我国正在进行营业税改征增值税试点,逐步扩大增值税的征收范围。煤炭企业作为增值税改革主要涉及对象之一,其增值税的税收成本值得
熟悉掌握带式运输机的结构,每个部件的功能及工作原理,全面掌握带式输送机的工作原理,研究其供电系统,研究矿用软起动器的电气工作原理,起动过程,控制过程。使用地点为煤矿井
以大佛寺4#不粘煤样为研究对象,进行4#不粘煤空气干燥基样和平衡水分样等温吸附实验,计算吸附势和吸附空间,得出吸附特征曲线,以期预测大佛寺4#不粘煤层中煤层气资源/储量,验
目的 掌握海南省生活饮用水中总α、总β放射性水平 ,为开发利用饮用水资源提供科学依据 ,以期提高全省居民生活饮用水的卫生质量。方法 根据自然和社会等因素确定采样点 ,
我国宪法规定的公民选举权指选举各级人大代表及国家公职人员的权利,这是广义上的解释;狭义上公民的选举权仅指选举各级人大代表的权利。本文所称的贿选,将研究范围限定为县