基于Hadoop平台的监控和行为审计关键技术研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:yesyouok
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着企业大规模数据在不同垂直业务领域的应用和扩展,得益于Hadoop集群的处理效率高、可扩展性强和成本低等特性,越来越多的企业将Hadoop集群作为主要的数据存储和处理工具。但是,由于Hadoop集群本身具有资源多样性、复杂性等特点,导致节点故障频发,给集群的资源监控带来了极大挑战。此外,Hadoop的安全机制相对薄弱且都属于静态安全技术,缺少对用户行为活动的监控,导致容易遭受隐藏的安全威胁,集群的数据安全难以得到保障。针对用户行为活动的监控,提出了一种Hadoop集群环境下的用户行为异常检测方法,提高了集群的数据安全性。在充分研究和分析现有资源监控技术的基础上,提出了一个监控框架整合改造方案,克服了现有框架的诸多缺点。在Hadoop集群用户活动监控方面,首先研究和分析了传统主成分分析算法的缺点,即在大规模数据情况下的内存限制以及效率不高的问题,本文分解算法中协方差矩阵的计算过程,基于MapReduce对其做并行化处理,较好的解决了上述问题。然后分析用户对HDFS的操作行为,提出了一个基于并行化主成分分析的用户行为异常检测方法,利用本文算法基于用户对HDFS的数据操作记录进行离线训练建模,提取其行为模式。检测时把当前用户的行为模式与训练得到的历史正常行为模式进行比较,基于欧氏距离度量标准评判当前行为是否异常。该方法不仅降低了数据特征的冗余,提高了数据处理的效率,而且具有较好的检测结果。在Hadoop集群资源监控方面,首先研究和分析了现有监控框架的优点和缺陷,选择Ganglia收集集群的监控指标,然后利用本文实现的数据抽取模块把上述指标与Nagios报警框架进行对接,满足Nagios状态显示划分等级的功能需求,最终提出了一个集监控和报警于一体的集群资源监控框架。本文框架充分利用Ganglia和Nagios各自优势,克服了Ganglia告警功能的欠缺和Nagios监控功能的局限,而且本文数据抽取模块使得Nagios避开了自身监控服务的开销,实现了整合框架的轻量级监控。最后,本文对Hadoop集群的资源监控框架和用户异常行为监控系统分别进行了设计与实现,通过实验验证了本文整合框架和检测方法的正确性和有效性。
其他文献
面源污染是海绵城市主要解决的问题之一,洛阳市作为河南省海绵城市建设试点城市,目前在面源污染研究方面尚处于空白阶段。本文通过对洛阳市面源污染的现状及特点,利用多因子G
[目的]系统评价肘关节置换(total elbow arthroplasty,TEA)与切开复位钢板内固定术(open reduction and internal fixation,ORIF)治疗老年肱骨远端骨折的有效性。[方法]计算
合格的原材料是企业生产优质产品的保障,结合美国石油协会API Spec Q1第九版《石油天然气行业制造企业质量管理体系要求规范》与以往在实际工作中的原材料管理,本文从原材料
研究性学习是一种以教师为主导、以学生为主体、以问题为导向、以创新为主线的教学方式,适应新时代研究生教育教学发展的客观要求。在研究生思想政治理论课程教学中引入研究
针对现有地貌分类法的不足提出地貌类型混合法。该方法将地貌类型划分为主体地貌和客体地貌,主体地貌是载体,客体地貌是被载体,把客体地貌混合表示在主体地貌之上,解决了现有
研究了砂率对砂轻页岩集料混凝土的折压比的影响规律,以河砂取代率为变化参数,用河砂部分或全部取代页岩陶砂制作成砂轻混凝土,进行了立方体抗压强度、抗折强度等力学性能指
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
山东钢铁股份有限公司济南分公司化工厂采用一整套低费用水处理技术,降低循环水的浊度和总溶解固体量,减少系统补水量,提高浓缩倍数,改善整体循环水的水质状况,降低处理费用