【摘 要】
:
随着计算机网络技术、信息技术和数据仓库的持续飞速发展,出现越来越多的分布异构数据源。异构数据源的研究已有很多成果,但由于子数据库和数据仓库中各种各样的异构依然存在,数
论文部分内容阅读
随着计算机网络技术、信息技术和数据仓库的持续飞速发展,出现越来越多的分布异构数据源。异构数据源的研究已有很多成果,但由于子数据库和数据仓库中各种各样的异构依然存在,数据异构仍然是数据仓库与其数据源语义匹配的一个严峻问题。一个有益的解决思路是在没有人工参与的情况下,主动数据仓库自动解决语义异构,准确识别数据语义。因此,如何提供语义匹配服务,帮助主动数据仓库解决语义问题,进一步提高主动性已成为国内外研究的热点。基于本体的主动数据仓库语义匹配可解决主动数据仓库在解释、执行主动规则和数据集成时的语义异构。使用户能够计算各个相应概念的相似度,系统不用另外的映射程序就能主动准确地集成数据,主动识别规则语义,成为名副其实的主动数据仓库。论文主要概述了异构数据和异构数据集成的发展状况,在研究背景的基础上讨论本体的理论知识及其构建、主动数据仓库的概念和相关内容。初步实现了一个基于本体的主动数据仓库语义匹配系统。根据系统的需要,按照构造本体的基本方法和实验的要求,设计了系统所需要的相应本体;算法部分在弹性匹配的基础上,提出了更加合适和精确判断匹配的概率匹配(Probability Matching,PM)方法;为了度量本体中两个类的相似度,提出了语义距离(Semantic Distance,SD)的概念并实现了具体的计算方法(包括深度距离和长度距离);然后在此基础上提出两种相似度函数:一种是长深距离计算法,一种是共享信息含量法。接着提出了项目和匹配系统的整体架构和算法的实现,最后完成了系统流程和框架结构的分析设计,并根据系统的需要测试出合适的阀值,利用各种图表比较和选择上面提出的各种算法。最后本文对系统的进一步研究工作进行了探讨。
其他文献
IP网络性能测量对网络研究与发展十分重要,可以用于分析当前Internet的基本特性,如网络体系结构和流量模型等。Internet因其异构性、业务类型的多样性且变化的随机性,使得人们对
本文从实际企业(圣茵花卉企业)在产品定价中所遇到的问题为出发点,对企业的定价的机制进行深入研究,给出BASS动态定价模型及相关的定价机制,再引入Agent技术对定价系统进行设计,
IPSec协议为IP网络数据通信提供完整性,保密性和身份验证,并支持丰富的保护模式和操作。尽管IPSec协议有很大的灵活性,但是,IPSec安全策略的复杂语义却使配置策略极易产生冲
导师苏开乐教授近年来新提出了基于本地会话的安全协议验证逻辑LLS(Logic of Local Sessions)。LLS逻辑基于安全协议的证明,它可以验证复杂协议的相关安全属性和处理多层认知
随着信息时代的发展,用户对信息的要求越来越严格,全面性、准确性、实时性变得十分必要。与此同时,信息的提供者也希望将自己的资源有偿或无偿地提供给更多的用户。因此需要
边缘检测是数字图像处理中的重要内容,也是至今仍没有得到圆满解决的一类问题。其原因一方面是由于课题本身的重要性,另一方面也反映了这个课题的深度和难度。边缘是图像的最
工作流是针对工作中具有固定程序的常规活动而提出的一个概念。通过将工作活动分解成定义良好的任务、角色、规则和过程来进行执行和监控,达到提高生产组织水平和工作效率的目
被称为是下一代互联网的网格计算,从它诞生那天起就受到了人们的广泛关注。它就像一台超级计算机,通过网格,我们可以整合的不仅仅是计算机和网页,还包括其他许多信息资源,如:
近年来,XML(Extensible Markup Language)己经成为互联网上数据发布和数据交换的事实标准。受到越来越多的关注。各行各业都在采用XML来描述本领域的信息,随着XML的普及,人们
引入错误级别的概念,提出了一种同时考虑测试集覆盖度与查错能力的双标准压缩模型。把设计的测试用例保存在测试集中,按照一定的覆盖度标准组织起来;运行用例发现的软件错误