质量驱动的数据仓库三层体系结构

来源 :中国海洋大学 | 被引量 : 0次 | 上传用户:taixiangle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据仓库的数据质量是数据仓库的一个重要概念。在以往的文献研究文献中提供了一种GQM模型,即Goal-Question-Metric模型,它采用质量问题询问的方法来改进数据仓库的数据质量。而它不能适应,日益增多的数据源及越发复杂的异构数据。 本文先对以往的数据仓库体系和有关数据质量的理论进行回顾,继而提出一种的数据仓库三层体系结构。在此结构中融合数据质量的要素,提出对其数据质量进行改进的方法,满足于对数据仓库各层不同的质量要求,从而达到对DSS的有效支持。本文重点描述了这个结构及其对数据质量有效支持的机制——簇和转换代理。在多个异构数据源基础上按照数据质量的需要,和元数据的相关描述,形成多级簇的阶层图。在簇的形成过程中加入了转换代理机制,这种机制克服了GQM方法的缺陷。在代理机制中,加入了知识检索工具,它不但用于划分形成簇,而且有效的把异质数据归类。同时加入了用于质量测量的测量代理,用于数据优化的优化器和评价机制。经过这些若干步骤转化,初始数据源的数据转化为接近甚至达到用户质量目标的数据。最后,因为数据仓库有时间特性,本文还加入了数据演化的有关理论和方法。
其他文献
该文论述了虚拟博物馆三维室内浏览人机交互系统,这个系统可以使用户方便的参观浏览虚拟博物馆,了解展品的各种相关知识.该文详细表述了系统中交互任务部分的设计与实现,利用
Java 是一项日趋成熟的技术,它从作为一种基于浏览器的脚本编制工具的商业起源演进而来.随着Java应用的普及与学入,对于安全问题,已经受到了越来越多人的重视.该文对于上述Ja
本文给出一个数据可视化系统的设计与实现方法,系统实现的环境是由多台indigo2和indy工作站组成的机群系统和以美国Oak Ridge国家实验室和Tennessee大学开发的基于消息传递模
电子商务的快速发展,使得物流配送面临前所未有的机遇和挑战。分布性和异构性是电子商务环境下物流配送决策支持系统的主要特点。 J2EE平台定义了许多用来构建分布式的多层
据统计,85%的信息系统中存在着与地理位置有关的信息,在这些信息中,既拥有地理信息、地理相关信息,又大量存在着以传统数据库表达的非地理相关信息。GIS(地理信息系统)是解决这些信