基于HDFS的云存储动态副本管理策略研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:monkey825
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的快速发展,云计算、社会网络、物联网等新兴技术为人们的工作以及日常生活带来了巨大的方便,与此同时数据的数量和类型也呈现爆炸式的增长。随着大数据时代的到来,云存储系统凭借其强大的数据管理与存储能力越来越受到用户的重视。为提高云存储系统的可靠性、可扩展性以及安全性等,副本技术被广泛采用。HDFS(Hadoop Distributed File System)作为Hadoop的分布式文件系统具有强大的数据存储与管理能力。HDFS的副本管理机制可以提高云存储数据的可用性,同时也提高了云存储系统的可靠性、读取效率以及负载均衡等。但是,HDFS采用的静态副本管理机制也存在一些缺陷:(1)在可靠性要求高的云存储系统中,存储大量副本提高了系统数据存储与维护成本。(2)由于云存储系统由大量廉价的节点组成,节点失效是常态,HDFS副本管理机制随机选择副本存放位置,未考虑数据节点的负载情况以及数据访问量动态变化,因此影响云存储系统的负载均衡。为了解决这些问题,本文提出了一种动态副本管理机制DRMS(Dynamic Replica Management Scheme)。本文的主要研究内容包括:(1)本文根据数据的可用性与副本数目之间的关系,动态计算与维护满足副本可用性要求下的最小副本数目,有效地节省云存储系统的存储空间。(2)为了提高系统的性能与平衡负载,本文采用动态副本放置机制,采用三种副本放置策略以适应不同的阶段与应用场景。在副本的创建阶段,采用面向用户的数据副本放置策略。在副本运行阶段,本文采用面向业务的副本放置策略,采用此策略可以满足大多数的请求者,从而保证系统与数据的高利用率。(3)副本调整策略可以节省系统的存储空间并且减少系统的维护成本。本文利用灰度预测模型,通过最近数据访问情况动态预测未来数据块的访问热度,并且动态的调整数据副本。如果数据块访问热度增加,动态的增加副本的数目;如果数据块访问量减少,则使用最近最少访问策略删除多余的副本,从而节省云存储系统的存储空间。
其他文献
基于国家形象和框架理论,本研究考察了在俄罗斯流行的与中国相关的社交网站VK.com上中国的国家形象。本文采用定量的内容分析方法,对“Magazeta”,“Tales of Laowai”,“EKD
仿人机器人的步行控制问题一直是机器人研究领域的重点和难点。目前,关于仿人机器人步行控制的方法主要是基于机器人的动力学模型,其所规划出的步态与人类的自然步态相去甚远
在电子商务和社交工具快速发展的今天,社交网络的规模和多样性持续扩大,社交网络的研究正逐渐成为数据挖掘研究的热点。获取社交网络中的紧密群体,如社交网络中针对特定人群
一线城市房价追高的同时,二、三、四线城市囤积了大量存量房。政府为稳定房地产市场,提出了提高城镇化率、深化住房制度改革、加快农民工市民化、扩大有效需求、消化房地产库
云计算是一种具有面向服务特征的计算模式,不同资源都以服务的形式提供给用户。云服务用户关心的重点是服务性能是否满足所签订的SLA,而对于云服务提供者来说,考虑的是在满足
热核聚变反应堆液态金属包层中的导电金属在强磁场环境下流动,导电金属流动过程中切割磁感线产生感应电流,感应电流在磁场中产生洛伦兹力,从而引起磁流体动力学(Magnetohydro
频繁序列模式的挖掘长久以来就被广泛地应用到各种实际场景中为商家或企业提供各种生产销售方面的决策支持。而随着科学技术的发展,数据获取和存储能力的不断加强,各种实际场
物理机耗能是云数据中心能量消耗的重要来源,而物理机上运行的任务多以虚拟机的形式存在。因此,如何优化虚拟机在物理机上的放置情况,在满足用户需求的同时,尽可能的降低云数
云计算的出现使得按需提供服务的资源供应模式成为可能,云环境中的应用通常都是以云服务的形态呈现给云用户,而对于服务提供商来说,他们通常希望在满足用户性能需求的同时,减
实验教学管理系统是一个基于Web的教学管理平台,是基于计算机网络传递、交流和处理的具有特定结构和教学管理功能的管理系统。其与传统的管理方式相比较,由于借助了网络来实