异构数据源关联挖掘及在决策分析系统中的应用

来源 :江苏大学 | 被引量 : 0次 | 上传用户:killsmagicer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
企业信息化建设过程中,由于事务处理应用的分散,“蜘蛛网”问题以及WEB技术急剧发展所带来的大量半/非结构数据,导致企业在发展过程中积累了大量以不同方式存储的业务数据,并且这些数据所基于的数据库管理系统也大不相同:从简单的文件数据库到复杂的网络数据库,它们共同构成了企业的异构数据源。综合利用这些信息能帮助企业更好地预测和把握未来。但是这种异构的、分散的数据却不利于发现有价值的信息。因此,研究异构数据源中的决策分析已经成为必然。 本文在综述异构数据源中数据分析系统的发展及目前研究现状的基础上,提出了先将异构数据进行集成,在集成基础上运用关联挖掘技术进行数据分析的方法,以实现一个异构数据源下的关联挖掘系统。 论文首先给出了系统的整体框架设计,以及主要的功能模块描述:接着介绍了系统中数据集成平台的实现;然后阐述系统的数据分析部分,其中主要研究与实现了OLAP中的关联挖掘算法,同时设计并实现了在XML数据上进行的关联挖掘算法;最后,在江苏长江电气集团的电子商务网站系统上,利用我们设计的算法实现了一个实用的决策分析系统。 论文的创新之处在于: 1.采用两步集成方案解决异构系统的数据整合问题。以XML数据格式完成主要的数据交互,实现数据的底层集成,将收集到的数据进行分流处理:对于以数据为中心的XML文档运用数据仓库技术进行高层集成,建立多维数据集,用于分析和挖掘;对于以文档为中心的XML数据则直接以XML格式保存,用于挖掘。采用两步集成方法不仅符合组件化的设计思想,同时,专门设立的XML数据交换平台可以充当“监视器”的作用,变“被动”分析为“主动”分析。 2.对适用于事务数据库的关联挖掘算法进行修改,实现了OLAP中的关联挖掘。利用数据仓库的维度建模和OLAP的多维分析,达到了一种多角度、多层次的“勘探式”的关联分析,同时实现了基于一定事实约束的关联规则挖掘算法。 3.通过详细分析XML的半结构化特点,我们采用半结构模型来表示XML数据,开发并实现了一个基于半结构模型的挖掘算法,利用此算法来弥补XML数据向关系表转换所带来的缺陷。
其他文献
随着互联网的蓬勃发展,传统的HTML数据交换方式已经越来越满足不了日益增长的数据交换的需求。微软NET的三大支柱之一XML作为一种极有前途的互联网上数据交换的新模式,己越来越
组件模型中,容器是组件的运行环境,为组件提供部署和运行所需要的技术服务。随着各种新型计算平台的出现和Internet信息网络的飞速发展,组件在执行期的环境变化越来越难于预测和
随着无线数据行业的快速发展和无线数据应用平台的广泛应用,无线数据应用平台之间及他们与普通桌面系统之间出现了广泛协同工作的需求。为了解决这个问题,必须构建可以使移动设
近年来,计算机技术和网络技术飞速发展,与人们生活的联系越来越紧密。人们享受着网络带来的各种便利的同时也受到了多种网络攻击的侵害。DoS(Denial of Service)攻击是目前网络
90年代以来,对于多Agent系统(Multi-Agent System,MAS)的研究已经成为分布式人工智能研究的热点.多Agent技术已经成为继面向对象方法之后出现的又一种进行系统分析与设计的强
随着计算机网络的不断发展,全球信息化已成为人类发展的大趋势,计算机及网络信息的安全和保密随之成为一个重要的问题。迫切要求解决网络安全问题。为保证计算机系统的安全,我们
在当今社会,信息交流和再教育日益成为发展的关键。在我国,远离大城市的广大农村迫切需要大量的信息和各种教育资源,来帮助它缩小与大城市的差距。由于农村用户的文化水平相对较
三值光计算机理论以光的三种基本状态(无光态和两个相互垂直的偏振态)来表示三值信息,采用成熟的二维液晶器件和其它的光电器件来实现三值光计算机关键部件.三值光编码、解码
本文分析了现有工作流管理系统的不足以及当前Web服务发展的新趋势,研究了当前Web服务和工作流技术的原理和特点,探讨了Web服务与工作流技术组合的必然,提出了一种基于Web服