HDFS异构集群中的分级存储调度机制

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:hbshwydd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大部分存储集群构建时可能包含有遗留设备及新购置设备,这些设备在存储性能方面存在较大差异.采用HDFS默认的机架感知存储策略时,可能使访问频率高的数据存储在低性能节点上,而访问频率低的数据存储在高性能节点上,既影响集群响应时间,又降低了资源利用率.针对以上问题,提出一种分级存储调度机制.在HDFS机架感知调度策略基础上,首先根据节点的CPU、内存大小、磁盘大小、磁盘I/O等固有硬件性能将节点划分为高配置节点和低配置节点,其次根据节点的CPU使用率、内存使用率、网络带宽使用率、磁盘使用率等性能的动态因素建立节点的性能评价模型,并建立三个性能级别.根据节点配置情况、性能级别及网络位置等多方面因素进行综合调度.同时在集群运行过程中,会根据数据的访问频率对数据块的分布进行动态调整.实验结果表明,本文提出的分级存储调度机制可以在HDFS异构集群中提高数据的访问效率,优化集群性能. Most storage clusters are built with legacy devices and newly acquired devices that have significant storage performance differences.Using HDFS default rack-aware storage strategies may make it possible to store high-frequency access data on low-performance nodes , While the low-access data is stored on high-performance nodes, which not only affects cluster response time, but also reduces resource utilization.Aiming at the above problems, a hierarchical storage scheduling mechanism is proposed.On the basis of HDFS rack aware scheduling strategy, Firstly, the nodes are divided into high-configuration nodes and low-configuration nodes according to the inherent hardware performance of nodes such as CPU, memory size, disk size and disk I / O. Secondly, according to node CPU usage, memory usage, network bandwidth usage, Utilization and other performance factors to establish performance evaluation model of the node and establish three performance levels.According to the node configuration, performance level and network location and other factors for a comprehensive scheduling.At the same time in the cluster operation, according to the data Access frequency to dynamically adjust the distribution of data blocks.The experimental results show that the proposed hierarchical storage Scheduling mechanism can improve data access efficiency and optimize cluster performance in HDFS heterogeneous clusters.
其他文献
本文叙述了传统的自动灭火系统与新型自动探火及灭火装置的不同点 ,并简要说明了新装置的系统构成、型式、适用场所及设计参数 This article describes the differences bet
将导数和自定义的e-导数结合在一起作为新的研究工具,而这两者(导数和e-导数)结合在一起能直接明确反映布尔函数的重量,深入到布尔函数取值的内部结构中去,讨论相关免疫H布尔函数的代数免疫阶、代数次数等问题,即严格雪崩性质、相关免疫性、代数免疫性及最高代数次数的相容性问题,得出Hamming重量为2n-1+2n-2这类H布尔函数的最低代数次数和最高代数次数、最优代数免疫等结果。同时,也给出了一些求布尔
2月26日,广东渔船渔机渔具行业协会第三届会员大会暨三届一次理事会会议在广州举行。会议选举产生了新一届理事会会长、副会长、常务理事、理事、监事,广东江龙船舶制造有限公
3.5万吨容量的中山黄圃草鱼种饲料市场,历来属于行业关注的核心市场之一.日前,笔者通过市场主要的饲料企业了解其现状及变化.rn关键词:市场高度集中rn据了解,中山黄圃草鱼种
期刊
目前,大多数医院还处于信息化澎交初级阶段、而硬件系统和软件系统的选型又是一个大问题.本文通过一些实际的软硬件选型方案、希望能给信息化建设刚起步或还没开始建设的同行
2003年11月15日~12月4日,以国家安监局安全科学技术研究中心主任为团长组成的培训考察团一行11人赴德国进行了培训和考察。在此期间,访问和考察了德国法兰克福机场应急系统;火
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
湘北虫草1号(审定编号:XPD009-2013) 由湖南农业大学、湖南省致远农业科技发展有限公司和长沙九峰生物科技有限公司联合选育.菌丝粗壮,洁白色,菌丝分枝能力强,转色快.在栽培
2004~2011年,在湖南省汨罗市对灯下二化螟越冬代诱蛾情况进行了逐日观察记录,结合当地多年来该害虫的发生及防治情况,摸索出了依据灯下蛾峰日确定第一代二化螟防治适期的方法: