论文部分内容阅读
本文对基于数据仓库技术的统计查询分析系统进行了探讨和研究。文中提出的“可扩展”的数据仓库体系架构,已初步作为方案被采用,待进一步完善后,作为中国石油数据仓库的体系架构;针对系统实现的ETL、多维数据模型、应用功能等方面的研究,对系统的具体实现有一定的借鉴和指导作用。
数据仓库是20世纪90年代初期提出的概念,它是数据管理技术上一个新兴的领域。数据仓库整合现有信息源中的各类信息,通过多维数据分析和数据挖掘,为管理层的宏观决策提供及时、有效的参考信息,使企业在激烈的市场竞争中把握先机。数据仓库作为一种新兴的数据管理技术,在世界上已经得到了一定范围的应用,但在国内的应用才刚刚开始,中国石油对数据仓库的应用研究还处于起步阶段。
数据仓库在数据的组织形式、体系结构、实施策略、实施方法等方面,与传统的数据管理技术存在较大的差别。本文结合数据仓库建设实际,针对中国石油统计业务现状及信息系统现状,对关键技术问题进行了研究。
本文充分借鉴了目前两种企业级数据仓库体系架构的优点,提出了“可扩展”的数据仓库体系架构。该体系架构保证了数据仓库在一定范围内的灵活性和可扩展性,满足了数据仓库长期发展的需要,并能有效的减少和保护前期投资。
文中的ETL研究,将主动的“数据抽取”转化为被动的“数据获取”,通过制定统一的业务标准采集数据,大幅简化了数据抽取的难度。多维数据模型研究针对具体案例,对多种实现方案进行了深入分析,并给出了最优的实现方法;应用功能研究对基于数据仓库技术的统计查询分析系统的应用功能,进行了较为细致的划分。以上部分研究对系统的具体实现有一定的借鉴和指导作用。