集群重删系统数据路由机制的优化研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:daisy8598
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代,全球数据量高速增长,给个人、企业和数据中心数据的管理和保护带来重大挑战。重复数据删除技术作为一种高效的数据缩减技术被广泛应用于数据备份领域,随着系统规模的扩大和数据量的不断增长,为满足备份系统在吞吐量和可扩展性上的需求,出现了集群重复数据删除系统。然而,集群重复数据删除系统不仅面对着传统重复数据删除技术所面临的指纹索引磁盘瓶颈和个人设备计算资源不足的难题,还面临因只对集群节点内部数据进行独立消重而导致的集群重复数据删除服务器节点信息孤岛问题。针对以上难题和挑战,本文在全面了解当前重复数据删除技术发展的基础上,针对特定的应用环境,提出了两种不同的集群重复数据删除系统路由优化策略,主要工作和创新如下:首先,设计实现了一个集群重复数据删除原型系统,包括备份终端、元数据管理服务器和多个集群重复数据删除服务器节点。备份终端将文件按照固定大小分块方式进行分块,然后使用强抗冲突哈希算法计算数据块指纹,再将多个数据块聚合成超块进行路由以减小通信开销;元数据管理服务器进行文件备份的会话管理并存储备份文件的元数据信息;集群重复数据删除服务器节点负责指纹匹配和数据块的存储。其次,针对数据中心数据备份过程中与集群重复数据删除系统节点的通信开销进行优化,提出基于应用感知的路由机制AR-Dedupe。通过添加路由服务器节点保存历史超块路由节点信息和存储节点的负载状况,来指导新的超块路由,有效减少节点间通信开销的同时获得了较高的全局数据缩减率,并且能够很好的保持系统节点的负载均衡。路由服务器节点针对不同应用建立相应的超块掌纹索引表,以加快掌纹索引效率。最后基于云环境下数据备份的集群重复数据删除系统,提出基于历史信息的一致性哈希路由策略HB-Dedupe。在集群存储节点识别备份终端热点(出现频率较高)指纹,然后保存在备份终端固定大小的buffer中,使用LRU算法进行替换,每次指纹索引前先在本地索引表中进行查询。通过三类真实数据集测试,可以减少20%~80%的指纹索引请求。
其他文献
近年来,无人机技术广泛的应用于军事和科研领域,网络化的无人机应用对广域侦察、跨障碍监控等任务有较好的适应性。执行任务时,在无人机反馈的各类信息中,视频流在实时性和直
本文主要研究基于小波变换的图像逆半调方法。因为小波具有多分辨率分析的特性,能够区分图像的高频与低频部分,所以适用于逆半调处理。小波变换通过去除高频半调噪声,同时最大程
自动并行化技术的研究是随着并行计算机的出现而开始的,如何用好并行处理系统以解决大规模科学计算问题是当前计算机科学面临的一个重要课题,开发高效的并行软件是解决问题的
跨越语言障碍,实现人们不同语言之间的自由交流,是人类自古以来的一个梦想。早在50年代和60年代机器翻译就吸引了相当可观的资金,尤其是军备竞赛在1957年苏联第一颗人造地球卫星
现如今,以CPU+GPU为主的异构模式被广泛的使用,06年CUDA编程架构的推出大大提高了GPU的可编程性,各领域内使用CUDA进行加速的应用程序大量出现。CUDA的架构中引入了STMD的概
无线自组网中各个节点可以任意的移动,导致节点间传输路径的频繁中断,大量的重路由操作消耗了有限的网络资源,降低了路由协议的性能。如何在这样的网络中选择一条稳定的路径,最大
近几年来,云计算技术得到飞速发展,互联网在线业务的用户也不断增多,导致大型企业的数据中心内部流量大幅增长、网络带宽资源竞争激烈。数据中心现有的转发机制是通过静态哈
随着全球信息化进程的不断深入,研究和实现基于网络的电子商务己成为目前学术界和商业界的热点问题之一。其中,安全问题日益成为电子商务发展道路上的一大障碍,为了保证电子商务
在现代MPI并行应用中,聚合通信操作被广泛使用。聚合通信操作不仅在科学计算上占据大部分时间消耗(有时可高达70%),同时也为程序员提供更便捷编程接口。然而软件实现的聚合通
随着信息社会的不断发展,计算机网络应用的不断深入,互联网已经成为人类获取信息的最重要途径之一。在信息爆炸时代,人们面对的烦恼不再是信息资源的贫乏而是资源过剩甚至于泛滥