一种基于Storm和Mongodb的分布式实时日志数据存储与处理系统的设计与实现及应用

被引量 : 0次 | 上传用户:jinhui4620
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大规模实时计算作为大数据计算的重要组成部分,大规模的实时日志数据计算正逐渐成为各个计算机或互联网系统重要的组成部分,实时日志处理正应用于实时统计,实时风控,实时推荐,实时监控、个性化服务、实时搜索等应用场景中。根据大规模实时日志数据存储和处理的需求,本文设计实现了一个基于MongoDB和Storm的大规模分布式实时日志数据存储与处理系统,本文详细介绍了系统的设计需求,系统架构和详细实现,解决了实时分布式多源异构日志数据日志的收集、存储资源浪费、负载均衡、降低能耗、数据分析流程复杂等问题,实现了大规模分布式实时日志数据的收集、分发、实时处理、实时查询、海量存储等功能。该系统基于分布式日志收集模块,消息发布--订阅模块,分布式存储模块、分布式实时计算模块,监控管理模块多个核心模块,提供一套完整的、稳定的、可扩展的、可容错的、分布式的、高性能的、节能的大规模实时日志数据存储和处理系统。本文基于Flume设计了一个分布式日志收集模块,实现多源异构日志数据的收集、分发和存储功能,该解决方案具有易动态扩展、分布式、高性能、容错的优点。针对大规模实时日志数据的突发性特点,本文设计了一种基于节能负载均衡算法的分布式实时系统任务调度模块,在满足性能需求的前提下,实现负载均衡和节能的目的。针对大规模实时日志数据访问具有很强的时效性特点,即当前一小段时间内的数据对结果的影响很大,会被频繁访问,以前时间的数据访问的可能性很小,设计了一种基于访问热度,把日志数据根据访问热度按不同存储策略存储的方案,并且将不同存储策略的日志数据分别存储在不同的服务器集群逻辑分区中,在满足性能的前提下,实现提高存储使用效率和节能提高能耗使用率的目的。
其他文献
<正>教学目标:《囚绿记》中矛盾的夸张处理艺术专家点评:这篇文章教学,一般老师都是将爱与爱的方式的矛盾作为教学目标,这其实是"非语文目标";执教者将这个目标定位为这种矛
<正>10月22日,《全国建筑设计行业收费指导意见》编制组第三次集中北京召开编审工作会。会议由北京市建筑设计研究院承办,徐全胜总经理等班子成员到会给予支持和鼓励。陈轸秘
<正>需警惕"转型陷阱"孙立平:现在我们确实面临着种种可能性,对现在面对的最基本的背景需要有一个准确的判断。有人说现在可能会陷入中等收入陷阱,有人说可能会陷入改革的困
期刊
爱国精神自古就已形成,其内涵与精髓随着时代的变迁而不停地产生着变化。本文以公元前57年新罗建国至公元936年统一新罗灭亡期间,朝鲜半岛所出现的爱国文学作品为研究对象,尤
大学章程在现代大学治理及推动大学自主办学建设进程中显得越来越重要,它是高校实现依法办学、依法治校的重要前提和根本保障。当前,大学章程的制定与研究已成为学界备受瞩目
高中文言文阅读在高中语文阅读中占有很大的比例,高中文言文阅读能力的高低直接影响语文阅读能力的整体水平,本课题在对影响高中文言文阅读能力的因素进行分析的基础上,对高
环境温度是测控设备稳定工作的重要指标,对其及时、准确地掌控显得十分重要。针对目前测控任务重、参试人员少特点,以LabVIEW可视化图形编程开发环境为平台,结合简单的硬件电
随着我国经济的快速发展,人们生活水平有了较大幅度的提升,可支配的闲暇时间增多,消费能力也大有提高,对自身健康情况开始重视,越来越多的人开始花钱买健康。体育旅游产业成
当今世界,科技的发展给人类带来了高度的物质文明,宗教问题由来已久,伴随着经济全球化的进程,已成为国际社会共同关注的焦点,也是人类在21世纪亟待认真研究的重大课题。西北
成本核算是成本管理的基础,成本核算数据的精确性、时效性直接影响企业成本管理措施的有效性。近些年,国际、国内市场的竞争日趋激烈,成本领先成为企业赢得市场竞争的关键战