论文部分内容阅读
本体作为一种语义和知识层面上的概念共享模型,自提出以来就引起数据整合、P2P系统、电子商务、语义Web服务、社会网络(Social Networks)等应用领域科研人员的广泛关注,并得到了有效的研究与应用,提出了一系列基于本体的领域问题解决方法。本体匹配(Ontology Matching)是发现不同本体之间实体元素(包括本体的类、属性或者个体)映射关系的关键技术,已被国内外学者普遍认为是解决计算机系统语义异构问题的有效手段之一。知识服务中的语义知识检索问题实际上是要解决用户检索条件和被检索的资源描述文本之间在语义级别上的匹配问题。最好的途径之一是将用户检索条件和资源描述文件都表示成可以被机器所理解的形式化知识表示下的语义信息,然后通过严格的逻辑推理和演算来评判两者之间的匹配程度。将查询条件和资源描述文本之间的相似度计算出来,按照相似度值将候选资源排序,最后将排序靠前的资源提交给用户。由于本体可以作为用户检索条件与资源描述文件的语义描述表现方式,而本体匹配可以解决本体的语义匹配程度问题。因此,本文试图将本体匹配技术作为知识服务以及知识检索问题的解决方案之一,尝试通过对本体匹配技术的研究来解决知识服务中的语义匹配问题。本文的研究从四个方面展开:(1)教育领域学习资源本体的建模与描述;(2)基于上下文的元素层次本体匹配;(3)基于加权本体的结构层次的本体匹配;(4)本体匹配算法在教育知识语义检索系统中的应用与实现。这些工作得到国家自然科学基金《知识本体的多层次语义相似性测量机制研究》(No.60673094),教育部重大科技项目培育资金项目《国家知识服务体系支撑技术研究》(No.705038),“十一五”国家科技支撑计划重大项目《数字教育公共服务示范工程》(No.2006BAH02A24)以及湖北省自然科学基金项目创新团队计划《知识服务理论及若干关键技术研究》(No.2006ABC011)的资助。本文取得的研究成果(创新点)包括以下几个方面:(1)教育领域学习资源本体建模与描述:针对目前学习资源元数据标准在表示学习资源时语义缺失的现状,对学习资源元数据以及学习资源元数据与本体结合的相关研究进行了调研,在Dragan Ga(?)evic、Marek Hatala等人提出的学习资源元数据与学习内容领域本体层次模型的基础上进行扩展。结合元数据本体和领域本体,形成了学习资源本体,并对元数据本体和领域本体进行了实例化,分别以IEEE LOM元数据和ACM CSS计算机学科领域本体作为具体的元数据本体和领域本体,结合本体建模原则,将二者有机的组合在一起,形成面向ACM CSS计算机学科领域分类系统的学习资源本体。与现有的学习资源本体相比,本文提出的本体模型更加全面和具体,而且主要研究面向学习资源的语义检索。学习资源本体模型的提出将为本文后续本体匹配算法的研究以及本体匹配算法的应用与验证系统的实现提供理论基础。(2)基于上下文的元素层次本体匹配算法:在对分析独立元素的方法和分析元素本体结构这两种元素层次匹配方法进行归纳,对基于WordNet和文本集合概率的语义相似度算法和基于元素本体结构的语义相似度算法这两种语义相似度比较方法进行分析的基础上,对现有的语义相似度算法进行了扩展,提出对Hirst & St-Onge语义相似度算法进行改进的元素独立语义相似性计算方法,并根据元素的上下文路径,进一步提出了基于上下文的元素层次本体匹配方法。该方法从元素以及元素上下文要素出发,将元素的前驱元素、属性、元素的后驱元素看成元素的上下文,并组成元素的上下文路径,针对元素的上下文路径,在分别计算前驱元素、属性、元素本身以及后驱元素独立语义相似性的基础上,进行组合加权,得到基于上下文的元素语义相似性。通过对OAEI 2006数据集进行查全率、查准率、F-Measure以及OverAll等指标的质量和性能评价测试。实验结果表明,基于上下文的本体匹配算法具有比较好的本体匹配质量和性能。(3)基于加权本体的结构层次本体匹配算法:在对各种基于图形结构的匹配算法的研究基础上,分析了加权本体结构图形的形式化表示方法。同时,还在此基础上研究基于加权本体的结构层次匹配算法。该算法采用自顶向下,分层加权的思想,根据学习资源本体的特点,给不同的层次实体分配不同的权重系数,通过将加权本体结构中所有实体元素结合在一起,进行实体绑定后的本体结构语义相似性进行计算,来完成加权本体的结构层次匹配。结构层次的匹配研究以基于上下文的元素层次的匹配算法为依据,通过二维矩阵进行存储和重用,在得到单个元素和属性的语义相似性的基础上,研究多个实体结合在一起的学习资源本体结构语义匹配。(4)本体匹配算法在教育知识语义检索系统中的应用与实现:综合前面第三、四、五章的研究内容,将本体匹配技术集成到教育知识语义检索中,设计并实现教育知识语义检索原型系统来验证本体匹配算法在语义知识检索实践上的正确性与可行性。为了验证教育知识语义检索系统的效率,将教育知识语义检索系统与我们开发的基于传统关键字检索的教育资源检索系统进行了检索实验结果的对比与分析,来检验该系统的性能和应用前景。