论文部分内容阅读
联机分析处理技术(OLAP)和数据挖掘技术均是决策支持的重要技术,两者在决策分析过程中可以分工合作、功能互补。但是两者的产生背景、发展历程、数据基础、分析层次、用户群等方面存在着较大的差别,这妨碍了两者在决策支持应用中有机、高效的结合。为了减少或消除这种差别,实现联机分析处理技术和数据挖掘技术的紧密结合,J.W.HAN于1997年提出了OLAM的概念,即OLAP Mining,他从统一两者的数据基础入手,提出在多维数据模型的基础上同时支持OLAP应用和数据挖掘应用的思路。但是数据挖掘所需的数据基础通常是多样的,单纯的多维数据模型使得数据挖掘的功能不能充分的发挥。 论文对OLAM的概念进行了扩展,对OLAM的内涵进行了深化,把OLAM定义为联机分析挖掘处理(On Line Analytical Mining Processing),实现对OLAP技术和数据挖掘技术的紧密集成。OLAM的数据基础不再局限于多维数据模型,而是包括多维数据模型、关系数据模型、对象数据模型和对象关系数据模型、半结构或无结构化数据模型等多种模型的异构环境。研究的重点为如何把OLAP与数据挖掘技术有机的集成在一起为用户提供高效地决策支持应用。 论文首次为OLAM技术建立统一的系统理论框架。作者在OLAM系统的体系结构、概念和逻辑模型、任/事务模型、事务的优化和调度、信息的组织和管理、OLAM语言的设计和分析、系统管理策略等方面提出了自己的见解。 论文在深入分析了OLAM应用的特点之后,提出了OLAM系统所应具备的十四条特性,这些特性同时可以认为是OLAM系统的建设准则,它对于构建和评价OLAM系统有一定的指导意义。在这些准则的基础上给出了OLAM系统的概念模型和逻辑模型。作者提出的OLAM系统概念模型界定了OLAM技术的研究范围,首次提出了工作仓库和导出对象存储的概念,明确了它们在OLAM系统中的重要作用。 论文通过对大量决策分析算法的分析,首次提出了基于限制(Constraint)的OLAM任务语义模型,这个模型从一定的逻辑高度对OLAM任务进行抽象,利用它可以分析OLAM任务的共性,提取OLAM任务执行时的基本操作,这些基本操作的基础是语义片断。论文给出了语义片断之间关联关系的分析和判断方法,提出了基于限制的、具有方向性的语义关联度定义。语义片断间的关系的确定是OLAM任务/事务优化的基础。 论文在对OLAM任务的特点和任务类别的分析的基础上,提出了一种新的OLAM任务/事务模型,这个模型通过AOR-DAG图来表示复杂的OLAM任务和事务,其中同时蕴涵了事务的控制流和数据流,是OLAM事务优化和调度的依据。 论文综合考虑了OLAM事务中的决定OLAM事务调度主要因素,首次提出了OLAM子事务的价值模型,一个OLAM子事务的价值包括自身价值、社会价值、继承价值三个部分,它与OLAM任务/事务模型相结合是OLAM事务优化的基础。论文还给出了OLAM事务间的多种协作模型,提出了“基于有效资源的事务价值最大最优先的OLAM事务调度策略”。并着重对OLAM事务调度过程中任务时效性的保证进行了讨论。 导出对象中的信息表示的是OLAM任务语义模型中的语义片断的内涵,它是OLAM事务语义相关性分析的基础,研究导出对象的数据模型、组织和索引形式、导出对象间的关系以及导出对象的维护方法对于OLAM事务的优化和执行有着重要的意义。论文给出了导出对象的数据模型和导出对象的价值模型,同时结合关系模型给出了导出对象间关联关系的高效判断方法。为了提高导出对象的维护效率,论文提山了一套导出生成原语,同时讨论了导出对象的维护和管理方法。 元数据是OLAM系统的核心,论文在对元数据概念、元数据管理策略进行分析比较的基“础上,指出了元数据管理方法的未来发展方向。同时结合OLAM系统中元数据的特点提出了基于XML的元数据管理策略,并给出了OLAM系统中元数据仓库的系统模型。 OLAM技术作为一种新的决策支持应用开发技术,从自身内涵到系统理论框架,有很多问题需要解决,论文对OLAM技术发展中需要迫切解决的关键问题进行了讨论,提出了一套系统理论框架,为OLAM技术的进一步发展奠定了基础。