论文部分内容阅读
因特网技术的发展和广泛应用,使得以各种形式存在的数据资源迅速膨胀。而这些数据资源往往分布于不同的网络环境,且采用不同的数据存储标准、存储格式和访问方法,这就造成了信息系统间的数据资源相互隔离,产生了信息孤岛问题。随着信息化建设的进一步推进,越来越多的用户和企业,都希望能够高效、透明和可靠地共享和处理这些数据资源。数据集成是把不同来源、不同格式、不同特点的数据在逻辑上或物理上有机地集中起来,实现分布、异构、自治数据的有效共享。实现异构数据集成,消除信息孤岛,已经成为当前计算机领域的一个研究热点。网格是一种新型的分布式计算平台,提供了共享和协调使用各种资源的机制,能够将异构、分布的资源组织为一个虚拟的计算机系统,其体系结构也逐渐标准化和规范化,已出现了相对完整的开发工具包,为开发分布式的应用提供了很多的功能组件。网格技术从科学研究领域逐渐发展到了应用阶段,成为解决复杂海量数据访问和管理的一种有效技术。本文主要是基于网格技术来研究异构数据的集成和访问。首先,分析了国内外数据集成的研究现状,介绍了异构数据的概念、特点、数据集成冲突和数据集成原则问题,重点分析和比较了各种异构数据集成方法。其次,阐述了Web Services技术的定义、模型、协议和技术特点及应用;介绍了网格技术的概念、体系结构、Web服务资源框架WSRF的提出背景,重点阐述了WS-Resource的定义、规范组件及其优点。再次,在研究Web Services技术和网格技术的基础上,重点研究了开放网格服务架构数据访问和集成中间件OGSA-DAI的体系结构、数据服务及其工作过程;通过搭建Globus环境,成功安装和部署了OGSA-DAI中间件,实现了通过OGSA-DAI中间件对不同数据库系统的访问;实验测试分析,给出了OGSA-DAI中间件存在的缺陷。最后,根据当前网络环境下异构数据的特点,提出了基于网格中间件技术的异构数据集成和访问系统DIAS的模型,设计了DIAS系统的核心功能组件,重点分析了实现DIAS系统的关键技术,给出了DIAS系统的部分功能实现,并从总体上对DIAS系统进行了性能分析。DIAS系统以Web服务的形式对数据进行封装,形成了松散耦合的数据集成方式,实现了数据“即插即用”功能,可扩展性强,很好地解决了异构数据的系统异构和语法异构问题,能够满足复杂网络环境下用户对异构数据源的访问需求。