知识服务的语义匹配机制研究

被引量 : 18次 | 上传用户:zybx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本体作为一种语义和知识层面上的概念共享模型,自提出以来就引起数据整合、P2P系统、电子商务、语义Web服务、社会网络(Social Networks)等应用领域科研人员的广泛关注,并得到了有效的研究与应用,提出了一系列基于本体的领域问题解决方法。本体匹配(Ontology Matching)是发现不同本体之间实体元素(包括本体的类、属性或者个体)映射关系的关键技术,已被国内外学者普遍认为是解决计算机系统语义异构问题的有效手段之一。知识服务中的语义知识检索问题实际上是要解决用户检索条件和被检索的资源描述文本之间在语义级别上的匹配问题。最好的途径之一是将用户检索条件和资源描述文件都表示成可以被机器所理解的形式化知识表示下的语义信息,然后通过严格的逻辑推理和演算来评判两者之间的匹配程度。将查询条件和资源描述文本之间的相似度计算出来,按照相似度值将候选资源排序,最后将排序靠前的资源提交给用户。由于本体可以作为用户检索条件与资源描述文件的语义描述表现方式,而本体匹配可以解决本体的语义匹配程度问题。因此,本文试图将本体匹配技术作为知识服务以及知识检索问题的解决方案之一,尝试通过对本体匹配技术的研究来解决知识服务中的语义匹配问题。本文的研究从四个方面展开:(1)教育领域学习资源本体的建模与描述;(2)基于上下文的元素层次本体匹配;(3)基于加权本体的结构层次的本体匹配;(4)本体匹配算法在教育知识语义检索系统中的应用与实现。这些工作得到国家自然科学基金《知识本体的多层次语义相似性测量机制研究》(No.60673094),教育部重大科技项目培育资金项目《国家知识服务体系支撑技术研究》(No.705038),“十一五”国家科技支撑计划重大项目《数字教育公共服务示范工程》(No.2006BAH02A24)以及湖北省自然科学基金项目创新团队计划《知识服务理论及若干关键技术研究》(No.2006ABC011)的资助。本文取得的研究成果(创新点)包括以下几个方面:(1)教育领域学习资源本体建模与描述:针对目前学习资源元数据标准在表示学习资源时语义缺失的现状,对学习资源元数据以及学习资源元数据与本体结合的相关研究进行了调研,在Dragan Ga(?)evic、Marek Hatala等人提出的学习资源元数据与学习内容领域本体层次模型的基础上进行扩展。结合元数据本体和领域本体,形成了学习资源本体,并对元数据本体和领域本体进行了实例化,分别以IEEE LOM元数据和ACM CSS计算机学科领域本体作为具体的元数据本体和领域本体,结合本体建模原则,将二者有机的组合在一起,形成面向ACM CSS计算机学科领域分类系统的学习资源本体。与现有的学习资源本体相比,本文提出的本体模型更加全面和具体,而且主要研究面向学习资源的语义检索。学习资源本体模型的提出将为本文后续本体匹配算法的研究以及本体匹配算法的应用与验证系统的实现提供理论基础。(2)基于上下文的元素层次本体匹配算法:在对分析独立元素的方法和分析元素本体结构这两种元素层次匹配方法进行归纳,对基于WordNet和文本集合概率的语义相似度算法和基于元素本体结构的语义相似度算法这两种语义相似度比较方法进行分析的基础上,对现有的语义相似度算法进行了扩展,提出对Hirst & St-Onge语义相似度算法进行改进的元素独立语义相似性计算方法,并根据元素的上下文路径,进一步提出了基于上下文的元素层次本体匹配方法。该方法从元素以及元素上下文要素出发,将元素的前驱元素、属性、元素的后驱元素看成元素的上下文,并组成元素的上下文路径,针对元素的上下文路径,在分别计算前驱元素、属性、元素本身以及后驱元素独立语义相似性的基础上,进行组合加权,得到基于上下文的元素语义相似性。通过对OAEI 2006数据集进行查全率、查准率、F-Measure以及OverAll等指标的质量和性能评价测试。实验结果表明,基于上下文的本体匹配算法具有比较好的本体匹配质量和性能。(3)基于加权本体的结构层次本体匹配算法:在对各种基于图形结构的匹配算法的研究基础上,分析了加权本体结构图形的形式化表示方法。同时,还在此基础上研究基于加权本体的结构层次匹配算法。该算法采用自顶向下,分层加权的思想,根据学习资源本体的特点,给不同的层次实体分配不同的权重系数,通过将加权本体结构中所有实体元素结合在一起,进行实体绑定后的本体结构语义相似性进行计算,来完成加权本体的结构层次匹配。结构层次的匹配研究以基于上下文的元素层次的匹配算法为依据,通过二维矩阵进行存储和重用,在得到单个元素和属性的语义相似性的基础上,研究多个实体结合在一起的学习资源本体结构语义匹配。(4)本体匹配算法在教育知识语义检索系统中的应用与实现:综合前面第三、四、五章的研究内容,将本体匹配技术集成到教育知识语义检索中,设计并实现教育知识语义检索原型系统来验证本体匹配算法在语义知识检索实践上的正确性与可行性。为了验证教育知识语义检索系统的效率,将教育知识语义检索系统与我们开发的基于传统关键字检索的教育资源检索系统进行了检索实验结果的对比与分析,来检验该系统的性能和应用前景。
其他文献
随着供给侧改革在我国的全面推进,国企改革逐渐成为国内学者持续关注的焦点,国有企业公司治理的完善是国企改革中的重要一步。本文结合我国实际情况,对国有上市公司的公司治
鄂尔多斯盆地中生界油气藏主要分布在晚三叠系延长组和早侏罗系的延安组,陕北斜坡集中了盆地90%以上的石油储量。油气来源于延长组的湖相沉积体系。受沉积相、构造条件、运移条
太宰治是日本文学史上一位颇具争议的作家。人们对于太宰文学的评价也是褒贬不一。众所周知,由于其复杂的人生经历,太宰生前曾被认为是一位离奇古怪的作家。但是,作为一种独
本文阐述基于IEEE802.3规范的以太网MAC协议的实现。首先从理论上对MAC层协议作了介绍和分析,然后重点对协议各主要功能的实现进行了讨论,设计以及功能的仿真。设计过程采用自
本文以现实主义作为切入点研究好莱坞电影,以时间发展为脉络、以历史事件为背景、以具体电影为例证,把好莱坞电影自身的发展同美国社会的历史演进相结合,论述了好莱坞电影史
古环境、古气候研究业已成为地球科学、环境科学等学科研究的热点和前沿领域之一。本文以中下扬子地区二叠系剖面为研究对象,在收集、消化和吸收前人研究成果的基础上,利用XRD(
本文对红外、可见光两种不同谱段图像的匹配技术进行研究,在对红外和可见光两种传感器成像原理分析的基础上,研究了图像预处理方法、相似性度量和匹配策略等技术,通过大量实
在市场经济快速发展的形势下,市场竞争日益激烈,需要企业加强内部控制,提高收益水平,降低运行风险。在这一过程中,内部控制工作的开展,需要结合企业的实际情况,针对性的设置
一、水稻移栽1壮秧标准水稻在移栽前要进行壮秧,主要是加强水肥的管理,增强秧苗的光合能力,通过外观观察能够看到秧苗叶片宽大,叶色青绿纯正,没有病虫害,根系发达,没有黑根生
知识是儿童作为意义生存者必要的精神元素与形成学习智慧的基础,其重要性毋庸置疑,课堂教学理应从知识的不同角度加以思考。本文以"用数对确定位置"为例,从知识的本源、内核