论文部分内容阅读
随着互联网技术的发展,一方面,对等网络的提出彻底颠覆了传统的客户机/服务器模式,为网络上新的应用提供了一个更新颖的拓扑结构;另一方面,“网格”概念的提出为互联网上的服务提供了新的途径,它的目的是试图实现互联网上所有资源的全面贯通,彻底消除资源孤岛。在此基础之上,又提出了“数据网格”的概念,它呈现给用户一个整合的虚拟数据资源仓库,将互联网上的各种异构数据规范为统一的接口,满足用户在整个互联网上查找相关数据的需求。
互联网是由许多主机彼此相连接形成的,网络上的数据是极为巨大的。用户的查找是面向如此巨大的数据,而且其中的某些数据是有相互关系的,如何对其进行组织、协调,使用户获得需要的数据,是一个十分关键的问题。需要有一种动态的数据集成机制来完成这个任务。它的作用是将网络上许许多多的数据通过一定的机制来处理,整合成一个统一格式的数据来供用户使用,为用户提供友好的服务。
本文讨论了一个基于P2P网络的数据网格系统——EFCS-Grid。文中概要介绍了EFCS-Grid系统的三层体系结构,包括门户应用层、网络执行层和数据资源层,以及各组成模块的主要功能。着重分析了在以Chord为基础的对等网络中数据集成的特点和需求,设计了两种基本的数据集成模式,包括联合操作和连接操作,以此为基础设计并实现了数据集成管理模块。在此基础上,针对数据集成的需求,根据对等网络的特点进一步研究并设计了三种数据集成优化策略,通过实际的测试表明达到了对数据集成进行优化的目的。最后对全文进行总结,讨论了本文的主要贡献,同时提出了下一步的工作重点。
通过实际验证,本文所提出的基于P2P的XML数据集成及其优化策略是可行的,达到了预期的目标。