Hadoop容错机制中的推测执行策略优化与研究

来源 :南京信息工程大学 | 被引量 : 1次 | 上传用户:between930
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络信息技术的不断发展及互联网数据的爆发式增长,传统的数据平台已经无法满足现有海量数据的存储与处理,分布式计算面临新的机遇。Hadoop的诞生使得海量数据的存储和计算成为可能,它是基于分布式存储平台HDFS和计算框架MapReduce的开源分布式并行计算平台。但实际应用过程中,常常会产生不可避免的硬件故障,因此如何保证平台存储的鲁棒性和计算的健壮性成为国内外学术圈的研究热点。本文主要研究如何保证分布式计算的健壮性,即Hadoop计算容错机制的优化。  推测执行是保证计算容错机制准确性的重要手段之一,它通过发现任务执行过程中的掉队任务并为其启动一个备份任务,以达到降低任务执行时间及节省集群资源的目的。本文围绕推测执行机制的优化展开研究,目的是提高掉队任务判断的准确性,并制定备份节点选择策略,将掉队任务备份到性能更优的节点,以达到保证容错机制的健壮性的目的,主要工作包括:  (1)为了提高推测执行过程中掉队任务判定的准确性,本文提出了一种基于任务进度实时感知的推测执行优化策略LWR-SE。首先,通过实时采集任务运行过程中的进度与执行时间信息,发现了两者存在局部线性关系,引入局部加权线性回归算法实时预测任务的剩余时间。其次,对备份任务的执行时间分阶段估算。最后,结合推测执行效益模型保证推测执行策略的整体效益。实验结果表明,与经典的推测执行算法相比,LWR-SE在实时任务剩余时间预测准确性、集群运行时间和吞吐量上性能更优。  (2)针对LWR-SE没有考虑到备份任务的资源调度导致节点利用率不高的问题,提出了基于非合作博弈的推测执行混合资源调度策略HRSE。将推测执行中产生的备份任务和原始任务的混合资源调度转化为多方非合作博弈模型,模型的输入为推测执行产生的备份任务和集群中未处理的原始任务,通过效益计算得出任务的可能执行节点集合,根据可能执行节点集合中效益的纳什均衡得出最终的资源分配方案。实验结果显示,与经典的推测执行算法相比,该调度方案可以有效提升节点利用率,降低任务总体执行时间。
其他文献
无需Wi-Fi信号,只开一个LED(发光二极管)灯就能无线上网,这件听起来好像不可思议的事却已经成为现实。  什么是可见光通信技术  可见光通信技术是一种先进的无线通信技术。它利用LED发出的肉眼看不到的高速明暗闪烁信号来传输信息,具有传输数据率高、保密性强、无电磁干扰、无需频谱认证等优点,是理想的室内高速无线网络接入方案之一。LED发出的光是一闪一闪的,因为闪动频率极高,达到每秒数百万次,我们的
随着社会的进步和互联网技术的发展,互联网上信息以指数级别迅速增长,信息爆炸已经成为当今社会一个很严峻的问题。当潮水般的信息涌向人们时,传统人工处理信息的手段己经远远不
对于无线网络,能量主要消耗于信道冲突,无关控制包的侦听等。在本文中,我们提出了一种新型周期性的混合MAC协议(PH-MAC)PH-MAC被设计为在以上过程中最小化能量消耗。除了能量
随着信息技术和Internet的发展,B/S三层结构得到了应用,其核心思想是把数据访问和业务逻辑放到中间层。现有水利领域数据访问中间件基于J2EE平台设计,能够较好的解决传统C/S结构下
本文通过对网上不良信息的格式,传送形式及信息过滤技术的深入研究,分析了传统过滤系统的弊端及在过滤系统中增加中文策略的可行性与必要性,实现了一个基于链路层数据的中文
目前,科学计算领域和商业应用领域中的数据呈爆炸式增长,实现对海量异构数据的统一访问和管理已经成为越来越迫切的需求。而随着网格技术的日益发展,在网格环境下如何访问已
在节点能量有限的Ad hoc网络中,如何降低节点的能耗、延长节点的工作时间是目前亟待解决的问题。目前提出的解决方案主要有数据链路层的功率管理和控制机制,以及网络层的以能