基于虚拟Hadoop的针对公交大数据架构的设计与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:carole_369
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前正处于一个信息爆炸的时代,海量的信息已经远远超过了人们所能接受的信息量,人们正经受着“信息过载”。大数据技术就是用来帮助人们从这冗杂的信息中整合和提取所需内容的技术。大数据是当前最热门的一个研究领域并且已经在渐渐地改变世界的商业模式。通过大数据技术,公司可以更加领会用户的消费行为以提供更专业的服务。在虚拟主机上部署大数据架构是当前大数据领域的热门研究方向。这个项目是针对公交大数据的一个实现。项目中的原始数据包括来自公交GPS装置的流数据,存储在关系型数据库中的历史数据以及一些系统外的在线服务产生的实时数据。这个项目的第一部分主要设计了一个可扩展的存储架构来存储这些不同来源的数据,并针对之后的数据分析合理的改变了当前的数据结构。项目的第二部分是设计一个合理的数据分析架构,以方便在这些海量的公交数据里面提取有用的信息。当前分析任务主要包括公交准点率分析和实时公交事故监控。公交准点率包括历史统计准点率,实时准点率,公交车准点率和站点准点率。实时公交事故监控包括检测当前道路是否存在交通拥塞,公交车本身是否存在异常行为。另外项目的最后部分就是将这些分析结果以一种优雅和易于理解的方式展示到网页上。项目的存储架构是基于虚拟Hadoop的,编程框架是建立在Spring框架和Shell脚本基础上的。在数据分析部分使用了Map Reduce,SQL查询和批处理等。数据展示是一个基于Bootstrap的简单Java Web应用。总的来说,这个项目包括设计和实现了一个针对公交大数据的可扩展架构,包括数据存储,数据分析和数据可视化等方面。此项目是瑞典爱立信和?stg?ta Trafiken公交公司的一个合作研究项目。总的来说,这个项目包括设计和实现了一个针对公交大数据的可扩展架构,包括数据存储,数据分析和数据可视化等方面。
其他文献
目的探讨老年2型糖尿病合并代谢综合征(MS)患者空腹血清抵抗素水平与胰岛素抵抗的关系。方法选取老年2型糖尿病患者82例,其中46例合并MS(MS组),36例不合并MS(非MS组),另选取
多投影拼接显示系统越来越广泛地应用于科学计算可视化、工业设计、虚拟仿真等领域。该系统要解决的一个关键问题就是颜色匹配,导致颜色不匹配的主要原因可以归结为投影仪自
<正>2月21日,中国社会保障学会在京召开《社会保障评论》(学术季刊)创刊座谈会。中国社会保障学会会长、《社会保障评论》主编郑功成主持了此次会议并介绍了期刊创刊情况,中
<正>2018年1月23日,国务院办公厅发布《关于推进电子商务与快递物流协同发展的意见》(国办发[2018]1号),2月7日,国务院常务会议原则通过了《快递暂行条例草案》(以下简称《条
目的探索和实践信息化基础的社区卫生服务机构-疾病预防控制中心-综合医疗机构的"三位一体"的慢性病综合管理模式。方法回顾性总结和分析2007—2010年全区社区卫生服务中心、
桂林岩溶水文地质试验场属于典型的峰丛洼地地区。峰丛洼地表层岩溶动力系统与土壤CO2密切相关,土壤CO2体积分数以及表层岩溶带土壤CO2溶蚀量的变化受气温和降雨影响。对不同
背景快乐生活俱乐部TM慢性病管理项目的目的 ,是通过帮助患者改变行为生活方式,改善患者对医疗服务的依从性和自我管理能力,有效地利用医疗服务,改善生活质量。糖尿病的共病
概述了碳纤维上浆剂的作用,综述了溶剂型、水溶性、水性乳液型及纳米粒子改性型碳纤维上浆剂的制备研究进展。
江汉平原高砷地下水的发现引起了广泛的关注,通过对该区高砷地下水监测场39个地下水样品的分析,揭示了高砷地下水的水化学特征。同时,结合沉积物砷含量分析和高砷地下水的垂
中国教师报:您是什么时候接触到情境教育,何时决定在全市中小学尤其是小学推广这种做法的?$$ 彭建伟:新课程改革以来,为适应我市教育现代化发展的要求,在深入思考如何更好地
期刊