论文部分内容阅读
数据仓库和OLAP是90年代初提出的概念,到90年代中期已经形成潮流。在美国,数据仓库已成为仅次于Internet之后的又一技术热点,以数据仓库和OLAP相结合建立的辅助决策支持系统是决策支持系统的新形式。为了便于对单一主题进行分析,对于表征主题间关系的数据,目前的数据仓库技术是通过将其转化成对应的单一主题数据的方式来实现的,从而忽视了这些表征主题间关系数据的存储问题。随着生物信息、互联网和电信等领域数据的不断丰富,数据仓库的应用逐步向链接丰富的数据集发展,新兴的多关系数据挖掘、基于图的数据挖掘、链接挖掘等已逐渐成为数据挖掘研究中的热点,对于表征对象间链接关系数据的提取需求已变得越来越强烈。同时,在这些链接丰富的应用领域,对于链接关系的OLAP分析也同样有着重要的商业需求,如何对链接关系进行多维分析已成为一个重要课题。本文针对目前数据仓库技术对链接分析支持不足的现状,通过对电信领域中用户间通话数据的深入分析,对于表征对象间链接关系的数据,作者提出了一种新的存储方式,并扩展了传统的基于单一对象属性的多维数据模型,使其可以对表征对象间链接关系的统计数据进行有效的表示,且给出了其相关的数学描述,并对各种面向链接的多维分析操作的具体含义给予了解释。同时,本文对面向链接分析的OLAP系统的总体架构进行了设计,给出了其中各个模块的详细描述,并针对链接分析的自身特点,设计出了一种新的前端展示方式,即以对象间关系图的方式进行分析结果的展现,从而可以使读者更直观地把握整个网络结构,更好地对对象间的关系进行分析。最后,本文将面向链接分析的数据仓库及OLAP技术应用于电信领域,针对某省某移动运营商的用户群间通话数据,编码实现了一个面向链接分析的OLAP原型系统。通过该实验,不仅验证了针对表征对象间链接关系数据所提出的新存储方式的可行性,也验证了面向链接分析的OLAP技术的重要研究价值。