论文部分内容阅读
随着计算机技术,特别是Internet技术的迅猛发展,在各行各业都逐步实现了数据、信息的计算机化管理。但是这些信息和数据是独立的,相互隔离的。传统的数据库集成方法现在已经远远不能适应人们从不同系统获取数据的需求。数据集成系统支持访问网络上不同位置的异构数据源,数据集成系统不仅能集成传统的数据库中的结构化数据,而且还可以集成在web上应用日益广泛的半结构化数据。异构数据集成系统的研究也成为当前数据集成研究的一个热点。
基于XML/XQuery的数据集成系统是一个异构数据集成系统,能够集成关系数据库、XML文档等不同数据源。系统采用Mediator-Wrapper方式集成异构数据,使用XQuery作为公共的查询语言,XML作为统一的查询查询和数据交换的模型。系统包括三个主要的部分:Mediator、Wrapper和名字服务器。系统使用这种方式具有可扩展性的优势,当系统增加新的数据源时,需要构造对应数据源的Wrapper,数据源的数据可以是半结构化或者结构化的,如关系型数据库,XML文档等等。
Mediator对用户输入的XQuery语句进行查询预处理和查询执行,并从名字服务器获得关于数据源的信息,从Wrapper管理器得到相应的Wrapper。Wrapper与各种数据源进行交互,提供查询的接口,对各种数据源的进行包装,为Mediator提供一个虚拟的XML视图,屏蔽数据源的差别,实现数据访问的透明性和位置的透明性。
开放GIS联盟(OpenGISconsortium)制定了符合地理空间数据组织特点的XML扩展集——地理标识语言(geographymarkuplanguage,GML),成为地理空间数据交换标准。利用GML提供的基本模型来组织空间数据,可以实现空间数据和非空间数据的无缝连接,支持XQury言的综合查询。
本文研究了面向数据集成的空间数据源wrapper技术,通过包装ArcSDE和OracleSpatial等不同类型的关系型空间数据源,实现关系数据模型到GML视图的映射;并基于这种映射将XQuery查询语言转换到SQL语言,取得查询结果并把查询结果根据映射规则组织成XML视图返回给Mediator,实现多源分布空间数据查询。