论文部分内容阅读
随着企业对决策管理信息需求的不断增加,传统的OLTP(联机事务处理)数据库系统已无法满足客户的要求,数据仓库和OLAP(联机分析处理)技术正是为解决这一矛盾而产生的新的数据库和信息处理技术。数据模型是数据仓库的核心问题之一,很多研究表明,传统的数据模型(如关系数据模型)难以有效地表示数据仓库应用中的数据结构和语义,也难以支持OLAP的应用。由于OLAP具有多维特征,因此多维数据建模技术引起了人们的普遍关注和广泛兴趣。XML是一种可扩展的标记语言,是W3C设计的一组规范,是SGML的一个子集,它是一种用于创建标记语言的元语言,是针对HTML和Internet设计的标准的、可扩展的、通用的数据格式。本文以数据交换与综合应用平台为应用背景,结合XML技术,构造企业级数据仓库多维模型,从而为决策支持提供了良好的数据基础。本文首先阐述了数据仓库的产生和发展,介绍了数据仓库和XML的关键技术,包括数据仓库的体系结构、OLAP相关理论、多维数据模型、数据挖掘及DTD、XML Schema和XSLT等技术。随后分析了PDX平台中数据仓库模块的业务需求,并同对CWM规范进行研究的基础上,设计出一种基于CWM的数据仓库体系结构。然后针对面向电力调度的数据仓库确定四大主题域和各主题的一致性维表,并对于每个主题用星型模型或雪花模型进行多维模型的设计,详细设计了相应的维表和事实表。最后结合XML技术,用XML Schema来描述数据立方,并通过与面向对象技术的结合使用,把数据仓库变成为数据立方和OLAP方法的仓库。这种数据仓库的实现方案,保证了数据仓库系统的稳定性、灵活性和可扩展性,适应了新一代WEB应用的需要。