论文部分内容阅读
随着全数字化的“大数据”时代的到来,云存储在海量数据的存储与管理中将起到越来越重要的作用。在云存储系统中,常采用副本技术来提高系统的可靠性、安全性、可用性和可扩展性。但是目前云存储环境下的副本管理技术,多局限于单数据中心,从容灾备份和负载均衡的角度,需要研究面向多数据中心的副本管理策略。面向多数据中心云存储环境的副本管理需要解决-些新的问题,例如,如何选择放置副本的数据中心,如何减少跨数据中心的数据传输,如何维护跨数据中心间数据副本的一致性,以及如何在提高数据可靠性与系统负载均衡的同时兼顾良好的用户体验等。目前,现有的云服务公司虽然已建立起多数据中心云存储系统,但是对其技术细节却鲜有披露。本论文重点针对多数据中心云存储环境下的数据副本管理策略,做了以下研究探索工作:1.全面了解了云存储系统、多数据中心及副本管理技术,重点研究了典型的云存储系统HDFS中的副本管理策略,并分析了多数据中心云存储系统中副本管理面临的问题;2.当前没有一个开源实用的面向多数据中心的云存储系统,针对这一问题,基于HDFS系统,本文提出了面向多数据中心的两层层叠式主从存储系统架构模型2CMSSS(2Cascading Master-Slave Storage System),简化了多数据中心云存储系统中副本管理策略的研究工作,从而为研究多数据中心云存储系统多副本管理策略及其后续的扩展、改善工作奠定了基础。3.提出了基于AHP—逆向云算法的数据中心选择策略。针对数据中心间的动态网络环境与数据中心间的差异性,本文提出了基于AHP—逆向云算法的数据中心选择策略,为后文提出基于数据中心选择策略与用户驱动的数据副本布局策略做了准备;4.结合云存储系统中用户访问情况和前面提出的数据中心选择策略,本文提出了基于数据中心选择与用户驱动的多数据中心云存储系统数据副本布局策略。仿真实验显示,本文所提出的基于数据中心选择与用户驱动(Data Center5. Select-User Drive, DCS-UD)的多数据中心云存储系统数据副本布局策略在系统负载均衡、副本访问速率和数据可靠性方面有较大优势;6.针对多数据中心云存储系统中数据副本一致性维护这一关键问题,本文总结了多数据中心云存储系统中数据副本一致性维护策略的设计目标与思路,并提出了基于2CMSSS和两段锁的数据副本一致性维护策略。实验仿真显示,该策略能够保证数据的强一致性,且用户访问时延较小。