数据仓库中基于本体的异构数据集成研究

来源 :江苏大学 | 被引量 : 4次 | 上传用户:Willy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
建立数据仓库时,集成的数据是进一步分析、统计和数据挖掘的基础。另外,数据仓库中的数据必须是共享、可重用的,而不是造成了新的信息孤岛。而数据仓库中现有的ETL方案只能在语法、结构层次上集成数据,无法解决数据的共享、重用、以及语义上集成的问题;ETL的过程非常繁琐,没有智能化,工作量巨大。本文针对上述问题,介绍了数据仓库中一种基于本体的异构数据集成方法,重点解决了集成中的语义异构问题。提出了数据仓库中基于本体异构集成的框架与总体流程:首先建立领域本体,在领域本体的指导下建立数据源的全局本体,各数据源分别建立局部本体,然后通过数据源局部本体与全局本体间的映射得到映射关系,再通过本体推理,得出隐含的语义关系,用最终的语义映射关系来指导数据抽取、转换和加载过程,实现数据仓库语义程度以及智能化的异构数据集成。在领域本体方面,研究了一个铁路货运营销CRM的领域本体,采用了W3C推荐的OWL作为本体表示语言进行描述。在上述研究的基础上,设计了基于本体的ETLT具——OntoETL,并结合铁路货运营销系统,利用本体异构集成的技术,详细分析和设计了货运营销CRM数据仓库的数据集成过程。
其他文献
随着云计算的广泛运用,越来越多的数据拥有者选择将本地上复杂的数据管理托管到云平台。公有云上数据的隐私信息会受到多方面的攻击,出于对数据隐私的保护,发布到公有云上的数据
随着信息社会的不断发展,各种大型企业需要保存的业务信息越来越多,使得数据库的规模也变得越来越大。数据库规模的不断变大,将会导致数据库系统性能的急剧下降,使得数据库维护的
如今多核技术的发展大大提高了计算机的运算能力,但也愈发使得内存子系统的性能成为计算机整体性能的瓶颈。如何提高片外DRAM带宽利用率是实现多核性能存储关键之一。而内存的
在对大规模科学数据进行处理时,往往会因为其具有规模大、特征复杂的特点,使得理解、分析这些科学数据,并从中获取知识变得十分困难,对于这些数据,科学家已经不满足于传统的
近年来,随着越来越多对等软件的问世,对等系统(Peer-to-Peer,简称P2P)迅速成为人们关注的一个热点。对等数据管理系统是一类用于共享结构化数据的对等系统,然而,数据映射表作
抽象状态机(Abstract State Machines,ASM)的基本思想可以追溯到上个世纪80年代.ASM的发明者Yuri Gurevich从数学领域转到计算机领域发现这样的现象:一个程序语言在不同的编
近年来,GPU设备的性能有了大幅的提升,但是现有的帧内预测相关工作却并不能有效地利用此类设备的强大的计算能力,其主要原因在于算法并行度不高。这些工作大多都只是停留在帧内
考试是检测学生学习成绩的一个重要手段,也可以在一定程度上评测任课教师的教学效果。在传统的方式下,组织一次完整的考试至少要经历四个步骤:人工出卷、考生考试、人工阅卷、成
混沌现象是20世纪人类最重要的科学发现之一。在过去的20多年时间里,人们对混沌的研究主要是从一些实验及数值模拟来观察和量化混沌。随着对混沌现象认识的不断深入,如何应用
均质压燃(HCCI)是目前内燃机燃烧领域的研究热点。HCCI是以预混合燃烧和低温反应为特征的燃烧方式。采用HCCI可以有效降低柴油机的NOx和碳烟排放,并提高内燃机的循环热效率。H