基于云的大数据处理系统性能优化问题研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：xiaohan521325

【摘要】

：

近年来,人们见证了数据的爆炸式增长,大数据已经开始深入到人们生活的方方面面。为了挖掘海量数据背后潜藏的价值,研究人员提出了 MapReduce并行处理框架,以应对传统数据库技

【作者】

：

徐华

【出处】

：

中国科学技术大学

【发表日期】

：

2018年期

【关键词】

：

大数据处理云计算虚拟集群调度数据放置任务调度

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,人们见证了数据的爆炸式增长,大数据已经开始深入到人们生活的方方面面。为了挖掘海量数据背后潜藏的价值,研究人员提出了 MapReduce并行处理框架,以应对传统数据库技术在处理大数据时的缺陷。MapReduce以“分而治之”的思想通过将海量数据分片到分布式集群中的节点中执行,从而大大提高数据处理的效率。它衍生出了 Hadoop、Spark等开源的大数据处理系统,受到了学术界和工业界的广泛关注。大数据处理系统离不开大量底层基础设施资源的支撑,然而初期昂贵的一次性经济投入以及后期繁杂的运维工作却阻碍了部分中小型企业运用大数据处理系统。因此随着云计算技术的不断发展,越来越多的企业和组织开始将大数据处理迁移到云中进行,充分利用云计算中按需自服务、弹性扩展的优势,缩短数据处理和分析的生命周期,提高生产效率。云计算为大数据处理带来了便利的同时,也给它带来了新的挑战和问题。本文在全面、深入地研究分析了现有的基于云计算的大数据处理系统的相关成果之后,以性能优化为目标,在云中大数据处理虚拟集群的调度、分布式存储系统的数据放置和大数据处理系统的任务调度三个方面展开了研究工作:首先,本文对云计算环境中大数据处理系统的网络性能需求进行分析和建模,充分考虑到云环境中网络资源的共享问题,刻画大数据虚拟集群竞争时可获得的最大网络性能。基于此模型,提出了面向网络性能优化的云中大数据处理虚拟集群调度问题。并针对此问题,设计了一个启发式的调度算法,目标是在满足时间要求的前提下,尽量寻找最优解,优化大数据处理系统在云中的网络性能。模拟实验表明该算法能够获得接近于最优的调度结果。然后,本文研究了云环境中Hadoop分布式存储系统的数据放置问题。针对云中虚拟机共存和异构性带来的数据可靠性下降和应用处理性能降低的问题,提出了一个基于位置感知的数据块放置算法。算法通过感知虚拟集群在真实物理拓扑中的相对位置进行数据块副本的放置,提高数据块的可靠性。同时通过前瞻性地预测各节点的处理负载,提高本地任务的比例,优化数据处理应用的性能。通过一系列的模拟实验和真实的集群实验分析,证明了该放置算法能够在满足实时性要求的前提下,加强数据的可靠性并且有效缩短I/O敏感型应用的处理时间。最后,本文研究了在云环境中运行大数据处理系统时的推测性任务调度问题。为了避免海量任务中的部分异常或者落后任务给整个应用作业带来的影响,大数据处理系统常常通过启动推测性的备份任务来缩短作业完成时间。推测性任务执行的关键在于对异常任务的精确检测和任务完成时间的预测,本文基于历史作业信息对当前的任务的执行时间进行辅助预测,并且提出基于全局速度和局部速度相结合的方法挑选异常任务,从而在精确检测落后任务的同时,避免异常任务的误判导致的资源竞争。实验结果表明该方法能够有效减少作业的完成时间。本文主要以性能优化为目标,充分考虑了云计算和大数据处理各自的特性和需求,对于大数据处理系统迁移到云中运行的相关问题进行了研究。首先本文提出了一个启发式算法寻求虚拟集群调度时的最优解。随后,论文提出了基于位置感知的数据块放置策略和基于历史信息的推测性任务执行方法,用以优化云中大数据处理系统的性能。我们希望论文的研究工作能够对云中大数据处理系统的设计提供有益的参考和帮助。

其他文献

浙江“十一五”改革报告

每一次总结,都是为了更好地向前发展。自第一个五年计划开始,到如今的"十二五"规划,任何一个五年,对于经济社会发展而言,都是必不可缺的历史阶段。在浙江,改革这场持久战已走

期刊

国际贸易综合改革试点扎实推进经济发展方式全面实施综合配套改革浙江省“十一五”

TiO2/Cu-TiO2复合材料的制备及其对甲醛降解性能的研究

采用水热合成法和混合法制备了TiO2/Cu-TiO2复合材料,在紫外光照射下,以光催化降解甲醛气体为探针反应,研究了该复合材料的光催化活性,对所制备样品的相组成、结构、形貌和光

期刊

TiO2TiO2/Cu-TiO2复合材料光催化剂降解甲醛

战略柔性框架下我国商业银行的创新战略选择——以16家上市银行为样本

以16家上市银行为研究对象,在战略柔性框架的基础上探讨我国商业银行在业务创新过程中的战略选择,即连续性力量和变革性力量对创新绩效的影响。结果显示:连续性力量正向影响

期刊

商业银行连续性力量变革性力量创新绩效

小型断路器分断过程动态仿真分析和试验验证

提出一种结合有限元分析软件Ansys与多体动力学分析软件ADAMS联合仿真断路器分断过程的方法。首先利用Ansys计算短路电流下电磁机构中动铁心的电磁力及动静触头系统间的洛伦

期刊

小型断路器AnsysADAMS动态仿真分析

张元素升降浮沉理论在中药组方配伍中应用的研究

目的:通过对张元素升降浮沉药性理论及其在中药组方配伍中的应用研究,以期厘清升降浮沉药性理论的古今流变脉络,归纳、总结其在中药组方配伍中的应用规律,为理解方剂的配伍提

学位

张元素升降浮沉药性理论组方配伍

慈善服务法律关系探究

在当前有关慈善活动的研究以及实践中,人们对捐赠、募捐以及志愿服务的关注较多,而对慈善服务的研究与关注较少。慈善服务作为整个慈善活动的最后关键一环,与其他慈善活动环

学位

慈善服务法律关系慈善服务主体权利义务法律责任

PX绿色合成新路线

<正>近日,中科院大连化物所副研究员李昌志等在绿色对二甲苯(PX)合成路线中取得新进展,设计出一条以木质纤维素资源生物发酵产物(生物基异戊二烯)和甘油脱水产物(丙烯醛)为原

期刊

绿色合成新路线氢转移分子内碳化钨

雷蒙德·威廉斯的文化价值观

关于文化的本体价值,雷蒙德·威廉斯认为,文化本质上是平常的,没有等级之分,因而他倡导建立共同文化,即完美的民主文化。关于文化的社会价值,他认为,文化与经济同样是"社会的

期刊

雷蒙德·威廉斯文化本体价值社会价值

规模化猪场主要细菌性疫病的流行病学调查

为掌握现代规模化猪场主要细菌性疫病的流行状况,本研究运用临床诊断和实验室方法对贵州省10家规模化猪场的220份样本进行了检测及细菌鉴定,以实现对副猪嗜血杆菌、胸膜肺炎

期刊

规模化猪场流行病学副猪嗜血杆菌胸膜肺炎放线杆菌猪链球菌猪丹毒杆菌

基于催化的S-V反应含酰胺键聚合物的合成新方法研究

天然的和合成的含酰胺键聚合物在我们日常生活中无处不在。天然的含酰胺键聚合物(多肽和蛋白质),在生命系统中起着至关重要的作用,例如酶的催化作用(几乎所有已知的酶都是蛋白质)、胶原蛋白的机械支撑作用、蛋白抗体的免疫作用以及血红蛋白的运输和储存作用都离不开蛋白质。人工合成的聚酰胺具有高强度、耐化学性腐蚀、耐热性,耐磨损和自润滑等特性,被广泛用作工程塑料和纤维产品。近年来,一些新型功能性的聚酰胺表现出良好

学位

含酰胺键的聚合物催化的Staudinger-Vilarrasa反应聚酰胺聚合物后修饰拓扑结构

基于云的大数据处理系统性能优化问题研究

其他学术论文