论文部分内容阅读
在数据网格中,通过数据复制为地理上广域分布的用户提供多个数据副本,能够减少访问延迟,增强数据局部性,提高数据可靠性,和分布式应用的可扩展性及性能。数据复制技术作为提高数据网格系统性能的重要技术,已成为数据网格领域中的一个热门课题。
由于数据网格的特殊性,数据网格系统对于数据复制技术的要求不同于其它应用领域的复制技术。论文首先分析了数据网格环境中复制技术的特点、复制系统的实现要求、复制技术的研究内容等。在研究了著名的GlobusToolkit网格计算工具包软件的体系结构、软件组成、和功能服务之后,介绍和分析本文基于GlobusToolkit提供的底层网格组件设计和实现的基于数据复制的两个应用:分布式音乐服务器系统GMusic以及多协议分块文件传输网格服务MPSFT。GMusic系统能够智能地选择速度最快的音乐文件副本,MPSFT服务可以建立多个TCP连接从多个文件副本同时分块传输,它们都展示了数据复制技术的应用前景。随后,本文基于开放网格服务体系结构OGSA,提出一个灵活通用的副本管理框架:通过该副本管理框架集成副本管理的各项功能,为用户提供统一的接口;同时该管理框架能够灵活配置,以满足不同数据网格应用的需求。论文的最后介绍几种任务调度和副本优化算法,包括作者提出的基于混沌时间序列预测的副本优化算法和基于文件访问历史的副本选择策略,在网格模拟器OptorSim上对算法进行仿真和性能分析,实验结果表明基于拍卖和预测模型的副本优化算法能有效提高数据网格系统的性能。