论文部分内容阅读
现代企业事务性信息平台日趋完善,企业事务性数据大量采集和积累,超越了企业现有的数据消费能力,企业数据生产相对过剩,数据查询和分析的速度和质量难以满足企业在复杂内外部环境下进行高效决策的需要。企业参数(Enterprise Parameters)是企业决策的重要依据,为在现代企业信息环境下实现企业参数的高效查询,研究者需要解决以下问题:如何在保证企业信息系统开放性和灵活性,保证分布式数据源的自治性和异质性的同时,实现数据源的有效集成和一致性访问、如何以与数据源具体形态无关方式表达复杂参数查询任务、如何设计有效的参数查询计划,使其适应多变的企业数据源环境。在国内外相关研究的基础上,进行了以下方面的创新和实践: (1)根据企业参数结构和相互关系的一般特点,提出企业参数空间(Enterprise Parameter Space, EPS)的统一高维模型;提出参数空间的分解与合并操作,给出参数空间的分解原则;提出参数空间及其子空间的表(Table)抽象策略,将企业参数空间映射为关系表的空间。 (2)在对参数空间的静态结构特征和动态访问特征进行分析的基础上,指出参数查询的OLAP(On-Line Analysis Processing)查询本质;在GMDJ(General Multi-dimensional Join)操作有关研究的基础上,提出可表达企业复杂参数查询任务的‘扩展通用多维链接(Extended GMDJ, EGMDJ)’操作;利用抽象关系表构造 EGMDJ表达式,以实现复杂查询任务与数据源无关的独立表达。 (3)提出企业参数语义驱动的查询策略,并给出查询系统的逻辑结构;提出企业参数集成本体概念(CubeOnto),并以描述逻辑语言ALC(ΣG)作为参数集成本体的理论模型;给出ALC(ΣG)语言元素的扩展规则,并基于这些规则提出ALC(ΣG) TBox中两参数概念间包含关系判定的Tableau算法。 (4)为满足参数查询的特殊要求,在传统描述逻辑包含(Inclusion)语义(I语义)的基础上,提出ALC(ΣG)蕴涵(Subsumption)语义(SI语义);给出相关的扩展规则,并基于这些规则提出ALC(ΣG) TBox中两参数概念间蕴涵关系判定的Tableau算法。 (5)针对ALC(ΣG)系统中概念间包含关系可能存在的不可判定问题(Undecidability),研究了导致不可判定性的主要因素,并通过对ALC(ΣG)的适当改造,给出ALC(ΣG)的多种可判定子集,有效扩展了ALC(ΣG)的可用范围。针对数量域上一般的不可判定情况,提出任务分解等处理策略。 (6)基于包含关系网络(Inclusion Lattice)和蕴涵关系网络(Subsumption Lattice)提出 CubeOnto本体知识库;给出可优化利用企业分布式数据源的参数查询计划(QPlan)构造算法;在QPlan基础上,提出企业参数的查询实现算法,并分析其复杂性;针对查询任务的几种典型情况,给出查询规划执行的优化方案。 (7)围绕某大型发电设备制造企业成本领域的参数查询问题,提出基于CubeOnto本体系统的成本参数查询方案;给出成本 CubeOnto的具体设计;基于DAML4Jess体系结构,以Jess推理机和DAMLplus表示方法为核心,提出成本参数查询方案的具体实现机制;分析该系统的实际运行效果。