【摘 要】
:
随着互联网的发展,数据需求处理量的剧增,分布式数据处理技术应运而生。而Hadoop作为Apache基金会下的开源分布式系统基础架构,以其可扩展、低成本、可靠和高效等众多优势在
论文部分内容阅读
随着互联网的发展,数据需求处理量的剧增,分布式数据处理技术应运而生。而Hadoop作为Apache基金会下的开源分布式系统基础架构,以其可扩展、低成本、可靠和高效等众多优势在发布之后就受到了各大互联网企业在各个领域的广泛应用。随着互联网的普及以及客户需求的不断升高,处理的数据量不断增加,大规模集群处理任务的速度和集群的功耗问题无疑将会面临更加严峻的挑战。Hadoop包含两个核心部分:HDFS(Hadoop Distubted File System)和Map Reduce。分别是分布式文件系统和分布式并行计算的框架。对于HDFS的优化主要是对读写方式与策略等传统技术的适应性调整,而对于Map Reduce性能优化的研究主要体现在三个方面:应用程序优化、配置参数优化和调度算法优化。本文着重关注动态的问题为异构情况下节点负载不均衡和对于动态负载协调性差的问题,于是本文提出了将集群监控模块和集群调度模块移迁移到从节点从而减少主节点负载的构想,并给出了设计流程图。在关于判定集群负载指标的问题上,对于一些传统的参数进行了分析,认为使用单一参数来判定节点负载状况存在着不小的弊端,并提出了通过当前节点最大并行任务数,节点队列长度,和CPU利用率等节点参数来推算出一下个时间戳下集群可能出现的负载状况。接着给出了利用预测负载状况来推断节点下一个时间戳节点的负载状况,然后根据预测结果来做出调整的策略。接着在本文的实验部分使用Cloud Sim仿真软件来模拟Hadoop集群。对Hadoop默认调度方式和经过优化调度方案的实验结果进行了比较和分析,验证处本文所提出的性能优化方案,确实能够优化集群性能,但本文优化方案确也存在着使CPU利用率浮动过大的问题。
其他文献
<正> 考查比较阅读,不仅可以考查学生语文基础知识的掌握情况,还可以考查到学生的阅读、分析能力,思维能力,语言的综合运用能力。那么怎样进行比较阅读训练呢?笔者认为,选准
我国古代爱情诗词代有绝唱.但受封建思想影响,许多人都不愿去研究它,实际上这些爱情诗词生动形象地反映了古人的婚恋观。这些爱情诗词大致可分为描写婚前男女相恋相交、婚后的感
成本管理是对构成产品成本各种因素及影响产品成本的各个经营环节实施管理,以达到降低成本,提高经济效益的目的。我国企业在长期的经营活动中,积累了很多的成本管理经验,但这
会话分析一直是语言学家多年来热衷于研究的领域,而话轮转换理论又是其中相当重要的一部分。西方的语言学家对于话轮转换的研究由来已久,并已形成一套丰富的系统框架理论。然
舌诊是中医学望诊的重要内容,是中医诊断疾病最常用的方法和特有的经验结晶。舌诊的客观化和标准化研究是中医诊断学的重要研究内容。近年来,随着计算机技术、图像分析技术的发
<正>第六章可然性46在世界上虽然没有机会这种东西,可是我们既然不知道任何事情的实在原因,所以这种无知正和"机会"在理解上有同样的影响,并且产生了相似的一种信念。任何一
“精细”作为一种修辞文本模式,一般多是建立在表达者力图突破人们所共同遵循的常规逻辑和表述惯例,以语言表达方式的新异性来激发修辞文本接受者的“不随意注意”,以此诱导接受
目前,网络诱致、放大、介入或主导的社会舆情事件频发。由于互联网的快速性、虚拟性和发散性,网络舆情事件可能由社会突发公共危机事件诱致,也可能由公共危机事件放大,网络舆
奥斯卡·王尔德(Oscar Wilde)一直是英美文学界的研究热点,其人其作品中的矛盾性更是引起了广泛的关注。但是,很少有人从其同性恋身份的角度去探讨王尔德的创作。在为数不多
目前,国内外学者对政治美学的学科边界还未明确,对于政治审美的概念定义与延展还没有完善,亟待不断尝试与更新。论文从“政治美学”的概念出发,明确了它的涵义与边界,并认为