论文部分内容阅读
随着企业信息化的推进和应用水平的不断提高,企业中积累的数据规模越来越庞大。如何有效地从大量历史数据中找到有价值的信息,从而帮助企业能够对未来变化作出及时正确的决策,最终在激烈的市场竞争中占据主动,已经成为当前企业越来越迫切想要解决的问题。数据挖掘(Data Miner)系统就是用于从大量的企业数据中挖掘出智能知识的软件系统。 济南市环境保护监测站自1999年开始进行了城市空气质量自动监测工作,积累了大量的空气质量监测历史数据,这些数据对整个城市环境空气质量进行分析和预测具有十分重要的意义,随着空气质量实时监测系统和重点污染源实时在线监测系统的建立,监测数据的增长更加迅速。传统的基于数据库模型的数据处理方法和手段已经不能满足对海量数据的管理和利用,急需新的技术支持,来实现对现有数据的分析和利用。 本论文讨论了一个环境空气质量的数据挖掘系统JNAQDMS(JiNan Air Quality Data Miner System)的设计和实现的相关技术,该系统是一个基于济南市环境保护监测站现有环境空气质量监测管理系统基础上的数据挖掘系统,初步满足了对济南市环境空气质量分析的要求,可以为济南市环境监测与保护管理部门的决策的提供辅助手段。 论文给出了环境空气质量的数据挖掘系统JNAQDMS的规划、分析、设计和实现的方法和过程。系统在环境空气质量监测信息管理系统的基础上,将现存的大量的实时监测数据,统计数据和其他辅助的数据所在的数据库和文件通过抽取、清洗、转化等步骤建立了城市环境空气质量分析数据仓库,根据决策管理的实际需要,面向不同的主题实现分析处理,从而为管理人员提供了分析型信息服务和一定的决策支持。 论文讨论了如何确定空气质量数据分析的主题,建立数据仓库的事实表和维表及如何将数据从源系统加载到本系统数据库中,设计实现数据抽取和数据清理、转换和整理的方法,利用数据挖掘分析方法对空气质量从不同的角度进行分析。 论文讨论了应用指数平滑技术和B-P神经网络技术—两种常用的数据挖掘