Hadoop集群实时性能监控及I/O性能优化研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:bowangmosong1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,作为海量数据处理的代表技术,Hadoop受到了越来越广泛的关注。Hadoop实现了分布式文件系统HDFS和分布式计算框架Map Reduce,其高扩展性,高容错性以及低成本的优势使得它广泛应用于数据中心,社交媒体,日志分析等大数据应用中。如今,很多公司所部署的Hadoop集群节点数都在千个以上,有的甚至上万。面对如此多的节点个数,Hadoop集群管理起来也越发困难。因此如何搭建Hadoop集群监控系统对集群的节点进行监控以确保集群正常高效的运行显得尤为重要。Hadoop集群的实时性能监控系统成为目前研究的重点之一。目前虽然有很多的第三方监控工具实现了对Hadoop集群的监控,但存在一些局限性,或是监控指标不全面,或者是对数据的收集分析和展示无法做到同步,即不能进行实时监控。本文的实时监控技术利用开源的Ganglia实时监控系统获取基本的监控指标,利用Hadoop所支持的JMX接口来获取Hadoop特有的一些监控指标,在Hadoop集群运行任务时实现较为全面的性能监控。本文的监控技术还并集成了Nagios作为警示报警模块,对集群的故障与错误进行预警,同时采用了Mongo DB来代替传统的Ganglia数据库RRD作为整个实时性能监控系统的数据库,可以长期保存监控数据的功能,以便在日后做决策分析时进行过期数据的分析。本文利用开发完成的Hadoop实时性能监控系统监控了三种Hadoop Join任务(Map Join,Reduce Join,Semi Join)的指标数据,并为其建立整个Map Reduce任务的I/O开销模型。为Map Reduce内部框架的I/O开销分析提供了好的视角。利用收集的数据作为依据,从监控的角度评估了算法的效率,并对比监控数据以此作为提示对Join算法进行改进,体现了实时性能监控工具的实际应用价值。
其他文献
房地产业是我国国民经济中的支柱产业,在宏观经济的发展中起到举足轻重的作用。自1998年我国取消福利分房制以来,我国的房地产市场得到了迅速发展。近年来全国各地的房价出现了高速增长的局面,影响了社会的稳定发展。与此同时,我国的人口结构正发生着巨大的变化,从上世纪90年代起,我国人口结构进入到了低生育水平的发展阶段,人口老龄化也不断加速。而房地产业与人们的生活息息相关,人口因素在其发展中起到重要角色,因
盲源分离是一项传统的信号处理方法,其研究是在源信号以及传输通道等信息未知的情况下,仅仅由观测到的混合信号分离和恢复出源信号,具有非常重要的理论意义和实用价值,在语音
数字图像经常会被各种各样的噪声污染,图像中的噪声一直困扰着人们,图像去噪是数字图像处理中一门很重要的研究课题。现如今出现了很多优秀的图像去噪方法,其中非局部均值(NL
近年来,随着经济一体化进程的加快,信息技术的飞速发展,计算机应用已逐渐渗透到我们的生活、学习、工作当中。基于B/S结构的Web应用,因其具有易用性、通用性和良好的可扩展性
二维材料作为一种新型材料,自发现以来蓬勃发展,现已涵盖了导体、半导体、超导体和绝缘体等各种类别。其独特的性质使其从光电器件和自旋电子器件,再到光电催化剂、柔性储能
在信息技术飞速发展的21世纪,信息技术正悄然改变着学生的学习内容和学习方式,正如2019年年末突发的新冠疫情,武汉封城,各中小学利用钉钉学习平台及各省的学习平台在线上开展
病理图像是疾病诊断的金标准,所以病理图像的质量对医学诊断至关重要。然而由于各种外界因素可能导致医生制作的病理图像存在噪声和边缘细节模糊等问题,使得病理科医生无法作
"互联网+"使数字劳动遍布各产业,不断拓宽数字劳工外延。以肇端浙江织里的重大舆情事件"妞妞案"为分析案例,基于"新自由主义式例外"理论,用民族志研究诠释微信平台何以建构"
CRTSⅢ型板式无砟轨道是我国自主研发设计的、具有完全知识产权的无砟轨道结构,采用预制轨道板,现场混凝土用量较少,施工简单,整体性较好,在我国大面积推广使用。CRTSⅢ型板式无砟轨道道床板由预制轨道板和现浇自密实混凝土层构成,若施工不当,轨道板与自密实混凝土层间会出现微裂纹等现象;在列车和温度荷载作用下进一步发展为更加严重的伤损,如轨道板与自密实混凝土层间离缝冒浆、层间脱空和自密实混凝土掉块等。一
面对公司,消费者存在信息不对称与组织程度不对等的天然不足,《消费者权益保护法》等法律从事后救济的角度为消费者权益提供保护,无助于从实质上矫正消费者相对于公司的劣势,