基于进化算法的本体匹配问题研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:myevanlee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本体是最新的一种信息交换参考模型,它是迄今为止用于获取最准确的语义规范化描述的技术。然而,由于本体设计者的主观性,对于同一个领域中的同一对象可能会有不同的描述方式(同一个概念在不同本体中可能会有不同的名字),这就直接导致了术语和概念描述不一致的异质本体的产生(即语义异质问题)。为了克服这一问题,在实现语义层面交互的同时充分利用本体灵活的表达能力,目前普遍认可的可行方法是执行本体匹配过程。本体匹配过程通过确定本体中语义相关的实体间的对应关系来实现本体间的相互通信。由于本体匹配问题通常可以建立成一个复杂的(非线性且有许多局部最优解)和耗时的(尤其当本体的规模庞大时)优化模型,因此通常会采用近似的方法来确定本体匹配元素以求解本体匹配问题。从这个角度来看,进化算法是一种求解本体匹配问题的有效算法。然而,已有的基于进化算法的本体匹配系统都存在以下五个缺陷:(1)经典进化算法的收敛速度慢和早熟收敛问题使得这些系统无法有效地确定大规模的和复杂问题的最优解;(2)在求解的过程中需要专家事先提供标准的本体匹配结果,而这种标准的本体匹配结果在实际的应用场景中是很难获得的;(3)无法一次同时匹配多对本体,即同时为不同的待匹配本体对确定一个统一的参数配置;(4)由经典的质量度量指标f-measure引起的质量度量偏好导致本体匹配结果的质量不高;(5)无法一次提供多组不同的本体匹配结果以满足决策者不同的要求。针对上述的缺陷,本文的研究工作主要围绕本体匹配领域中的单目标和多目标优化问题展开,全文的内容可概括为以下几个方面:(1)建立了基于部分参考匹配结果的本体元匹配单目标优化模型,提出了基于部分参考匹配结果的度量方法并进一步提出一种本体概念聚类算法以构建部分参考匹配结果,并在此基础上提出了一种基于部分参考匹配结果的混合Memetic算法的本体匹配方法,给出了用混合Memetic算法求解基于部分参考匹配结果的本体元匹配单目标优化模型的详细步骤:预处理程序、混合Memetic算法个体编码方案、遗传算子和局部搜索算法。实验采用本体匹配领域公认的测试数据集,即本体匹配评价竞赛(Ontology Alignment Evaluation Initiative,OAEI)的Benchmark测试数据集,提出了混合Memetic算法的本体匹配方法的参数选择原则并给出了具体的参数配置。实验结果表明,基于本体概念聚类方法构建的部分参考匹配结果的混合Memetic算法能比基于随机方法构建的部分参考匹配结果的混合Memetic算法找到更好的解,这些解的质量不仅十分接近基于参考匹配结果的方法而且解的查准率都很高。Wilcoxons测试结果表明本章提出的方法在性能上比起经典的基于进化算法的本体匹配系统GOAL的平均的改进程度为47.33%。基于部分参考匹配的混合Memetic算法也能够克服经典遗传算法的早熟收敛问题,从而获取比基于经典的进化算法的本体匹配系统以及其他前沿的本体匹配系统质量更高的解。(2)建立了基于无参考匹配结果的本体元匹配单目标优化模型,提出了基于无参考匹配结果的度量方法,并进一步提出采用一致性度量比率(Unanimous Improvement Ratio,UIR)结合基于无参考匹配结果的度量方法来共同度量本体匹配结果的质量,以克服质量度量的偏好问题并实现同时匹配多对本体(即为多对本体提供一致的最优参数匹配方案),并在此基础上提出了一种基于无参考匹配结果和UIR的混合Memetic算法的本体匹配方法。实验数据采用OAEI 2012的Benchmark测试数据集,实验的结果表明基于无参考匹配结果的度量方法和一致性改进比率度量的混合Memetic算法不需要专家事先提供标准的本体匹配结果、能够同时匹配多对本体、在克服质量度量偏好问题的同时能够获取比前沿的本体匹配系统质量更高的解。(3)建立了以查全率和查准率为目标的本体元匹配多目标优化模型,给出了通过进化算法求解本体匹配多目标问题的动机和多目标进化算法的Pareto前沿中代表性解的选择方法,分别采用NSGA-II和MOEA/D求解本体元匹配多目标优化模型。提出了一种自适应的相似度集成策略以提高NSGA-II的求解效率,给出了MOEA/D优化目标的分解方法和算法的实现细节。实验数据采用OAEI 2012的Benchmark测试数据集,T-test静态分析结果表明基于自适应的相似度集成策略的NSGA-II的本体匹配方法和基于MOEA/D的本体匹配方法都可以找到比基于传统进化算法的本体匹配系统和其他前沿的本体匹配系统相同的或是更好的解。此外,通过Wilcoxons测试的结果表明基于MOEA/D的本体匹配方法在性能上优于基于NSGA-II的本体匹配方法。(4)建立了以查全率和查准率为目标的本体匹配多目标优化模型,提出了新的实例相似度度量技术和相似度扩散算法,设计了新的个体编码方案,并在此基础上提出了一种基于实例的NSGA-II本体匹配方法。实验数据采用OAEI 2012的Benchmark、Anatomy和Library测试数据集,实验结果表明基于实例的NSGA-II本体匹配方法获取的本体匹配结果的质量在前沿的本体匹配系统中排名前列。
其他文献
<正>目的制定并验证中文版DN4量表(Douleur Neuropathique 4 questions),为神经病理性疼痛提供一种新的诊断量表。方法 1、制定中文版DN4量表:为确保DN4翻译的语言信度及真实
会议
复杂多变的路面状况对野外作业车辆的越野性能提出了严苛的要求。二自由度铰接式结构的轮式车辆具有转向半径小、机动性好、地形适应能力强等优点,广泛应用于复杂地形下的作
当今社会是一个信息时代,计算机早已深入到人们生活工作的各个方面。信息技术作为一门全新的学科,必须要有新的教学方法,体现出新的学科特色。在信息技术教学过程中,要充分利
伴随着社会主义市场经济体制和现代企业制度的建立,我国大多数企业都已成为自主经营、自负盈亏、自我发展的现代企业经营者。企业要想在激烈的市场竞争中持久生存下去,一定要
我国地方政府财政运行进入收支矛盾加大、赤字持续增长的"新常态"。因此通过文献梳理,深刻认识我国地方政府债务的演进逻辑,对于理解地方政府的债务问题具有重要的理论和现实
文章通过对中国铁路现行区域管理(铁路局管理)模式下运输成本核算方法的实证分析研究,建立了中国铁路现有区域管理模式下的运输成本核算管理模型,在此基础上提出了市场经济条件下
随着经济和社会的快速发展,电子商务的发展态势也愈演愈烈。据中国电子商务研究中心发布的《2017年(上)中国电子商务市场数据监测报告》显示:2017上半年中国电子商务交易额达
作为一名工作在一线的中职学校政治课教师,政治课教学必须紧跟时代步伐,从学生的身心特点出发,因材施教,运用多种手段与方法着力培养学生的认知能力、创造能力以及发展潜能,