论文部分内容阅读
在过去的半个世纪,信息技术、计算机技术和网络技术的发展已经从各个方面深刻影响了供水系统的生产和管理,出现了SCADA, EMS, GIS等信息系统,为供水企业的日常运营和管理决策提供了很多方便。但现有这些信息系统还有一些问题函待解决,如数据不能共享、集成度低、海量数据信息特征提取困难等。而基于这些系统数据信息基础之上建立的数据仓库以及联机分析和数据挖掘技术的应用,能够很好的解决以上的问题。数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,是用于支持管理决策过程所需的集成数据。联机分析是用于对数据仓库进行查询的一种技术,它尤其适用于对大量数据进行快速的分析。数据挖掘是采用人工智能的方法对数据进行分析获取知识的过程。本文主要研究了数据仓库和数据挖掘技术在供水企业中的应用。在介绍了有关课题背景之后,首先介绍了数据仓库的总体构架。针对供水系统中大量的数据不能有效利用这一现状,提出了基于数据仓库的,能够为联机分析和数据挖掘提供快速、有效数据响应的解决方案;在需求分析的基础上根据三级模型建立数据仓库的数据模型,并且利用SQL Server 2000提供的数据转换服务DTS将各个业务数据库中的数据转入数据仓库,从而形成以生产和经营为两大主题的数据仓库环境。然后,在数据仓库这一统一的分析环境中,首先建立数据立方体,接着利用MDX语言和数据透视表对数据进行多维分析,使管理者能够从不同角度查询和分析现有数据。最后,利用数据挖掘技术中的关联规则算法,对供水系统中管道维修历史数据进行挖掘计算,得到了一些有用的规则。本文从理论、系统模式和实施技术等方面对数据仓库和数据挖掘技术在供水系统中的应用进行了一次初步的尝试。本文建立的数据仓库系统只是一个过程的开始,为供水公司未来的系统发展提供了一个可行的、有实际意义的、体现了先进的数据分析和系统设计思想的基础。但由于数据仓库的建立是一个长期艰巨的任务,加之时间有限,许多功能尚待开发与完善,有望在将来完成。