基于Hadoop的网络流量数据处理系统的实现与应用

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:netease
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
历经多年发展,我国互联网已成为全球互联网发展的重要组成部分。截止至2013年6月底,中国网民规模已达到5.91亿,互联网普及率约为44.1%。在互联网高速发展的同时,所暴露出来的问题也日益突出。一方面,不断增加的用户数量和层出不穷的新兴业务,使得互联网流量数据激增,网络拥塞的情况日益频繁,对网络服务质量提出了更高的要求。另一方面,由于互联网体系结构的复杂化,使得对于互联网流量特性、用户行为特征、新兴业务的流量特征等问题都还缺乏深入的理解和精确的描述,从而严重影响了互联网的进一步发展和网络资源的有效利用。与此同时,由于网络流量的剧增,传统的流量分析方法已无法满足海量数据的存储和处理要求,需要引入更高效、更可靠的方式进行处理。而Hadoop正是一个能够对海量数据进行可靠的分布式处理的可扩展开源软件框架,并已经被应用于越来越多的研究领域。本文首先介绍了Hadoop的基本概念,包括Hadoop和HBase的工作原理。随后,在Hadoop技术的基础上,本文提出了网络流量处理系统的三层体系结构,将网络流量的采集、存储、处理和分析等独立的功能整合到一起,形成具备完整功能的网络流量处理系统。接着,本文对网络流量处理系统的数据层进行了重点研究。先后详细介绍了数据层的非实时组件——基于Hadoop的网络流量数据控制组件,以及实时组件——基于HBase的流记录控制组件。通过对这两个组件的研究,解决了海量网络流量分析领域中的一些重要问题。最后,本文以智能终端流量特征分析为例对网络流量处理系统的应用层进行了说明。
其他文献
随着数字化技术的不断发展,数字化地籍测量作为一种先进的地籍测量技术开始得到广泛应用。为此,论文以浙江省某市展开的城市地籍调查为例,对数字化地籍测量在城镇地籍调查中的应用进行研究。
随着我国加入WTO,逐步开放国内电信市场,整个电信行业市场重新布局,加剧了我国电信行业的竞争形势。同时,随着国家调整了对原本属于运营商专属经营的VOIP、数据中心、虚拟运
对盾构隧道下穿铁路施工技术进行分析,介绍了工程概况,阐述了盾构隧道下穿铁路施工技术的应用,并提出具体的注意事项,希望能够为相关工作人员起到一些参考作用。
伴随着网络的高速发展,大数据时代的降临,海量网络流量数据的处理需求也应运而生。为满足海量网络流量数据的处理需求,对网络流量进行有效、深入地分析,实现对网络流量有力监
结合甘肃省临夏州康乐县实际,阐述了玉米生产全程机械化技术应用推广情况,并针对存在的问题,提出了发展建议。
摘要:针对锑金精矿的火法处理工艺存在流程复杂、能耗高、环境污染严重、贵贱金属回收率低等缺点,本文对某锑金精矿进行了湿法提取锑和金的工艺研究。对含锑24.76%,含金48.50g
分析了影响境外设计公司设计理念落地效果的主要原因,以杭州金色家园·金色海岸园林深化设计与施工过程为例,总结了提高园林品质的经验,包括采用新的施工方法、工艺技术和材
中国风景园林学会定于2009年9月11~13日在北京举办中国风景园林学会年会。本次年会的指导思想要求贯彻胡锦涛总书记在纪念中国科协成立50周年纪念大会上的讲话精神,深入学习实