论文部分内容阅读
随着GML 形式数据的大量涌现,如何对其进行有效地存储和管理,已经成为GML 应用研究的热点之一。GML数据是基于XML 编码的空间数据,它的半结构化特性与传统的关系模型存在着较大的差别,这导致传统的关系数据库并不适合GML 空间数据的存储、查询与索引。本原XML数据库系统是XML数据管理领域新兴的一种数据管理系统,它以特有的存储模式支持XML数据的半结构化特性。因此,考虑利用本原XML数据库存储技术,构建一种既能支持GML文档集的高效集约存储,同时又可以满足GML 要素和结构语义信息提取的本原GML数据库系统,是解决GML 存储和分布式查询、共享等问题较为合理的研究思路。参照传统空间数据库和本原XML数据库系统,一个本原GML数据库系统应当包含面向GML的解析、存储、查询、索引等技术,如果涉及版本化或数据库安全等内容,其研究将更加复杂。基于此,本文在构建本原GML数据库系统体系框架的基础上,重点开展本原GML数据库系统的核心问题——本原GML存储技术与方法的研究,以期为本原GML数据库系统的研究奠定基础。
本文主要研究工作如下:
(1)提出了本原GML数据库系统的体系框架,并在此基础上,构建了GML数据库系统的存储技术体系NGDST(Native GML Database Storage Technology),包括与用户或应用系统交互的操作模型、表达数据库内部结构的逻辑存储模型和定义数据在文件中存储方式的物理存储模式。
(2)提出了面向GML 文档语义操作的GML 文档对象模型GDOM(GMLDocument Object Model),设计了模型包含的对象类型与接口体系,定义了描述GDOM结构与内容信息的元数据文件及其模式文件,实现了GDOM的可持久化。
(3)设计了NGDST的逻辑存储模型与物理存储模式。分别定义了逻辑存储模型中数据部分与索引部分的存储结构。创建了与存储模型相匹配的物理存储模式,定义了其中物理文件的存储方法。
(4)设计并开发了NGDST 原型系统NatvieGMLDB(Native GML Database),设计并实现了基于NGDST的GML 非空间查询、空间查询、混合查询以及文档重构的流程与算法,定义了查询的基本接口并分析了查询的效率。通过对比开源本原XML数据库软件与NatvieGMLDB的存储和查询效率,验证了NGDST的可行性与有效性。
论文的创新点主要体现在以下两个方面:
(1)突破以往将GML数据当做XML数据直接存入本原XML数据库的存储方法,提出面向本原GML数据库系统的存储技术体系,并据此实现数据库系统原型,有效地将GML 解析、索引、存储以及查询技术融为一体。
(2)首次提出面向GML 语义操作的可持久化GML 文档对象模型,提供标准的、可互操作的类和方法的集合,用于基于语义的GML 文档元素检索与内容定位。为存储条件下GML 文档的操作提供可以借鉴的方法。