【摘 要】
:
大数据环境下,快递行业的信息量骤增且呈现时间集中特点。传统数据库无法满足当前快递行业信息存储要求。新型大数据处理工具Hadoop平台,能很好的适应社会发展发展需求,对各
论文部分内容阅读
大数据环境下,快递行业的信息量骤增且呈现时间集中特点。传统数据库无法满足当前快递行业信息存储要求。新型大数据处理工具Hadoop平台,能很好的适应社会发展发展需求,对各类数据均能大规模存储,满足企业对数据的掌控能力。通过挖掘大规模数据规律,发现其中潜在价值。而搭建在Hadoop平台的Hbase数据库能够大批量存储小规模各类数据,满足企业尤其是中小企业对数据挖掘的需求。对Hbase数据库理论研究,将其应用在快递行业,对快递行业产生信息进行存储、分析,便能让企业头疼的快递数据信息变废为宝。为了解决快递行业数据信息存储面临的“数据浪费”问题。本文研究了Hadoop分布式存储与计算平台的搭建,并将Hadoop的分布式计算系统MapReduce的数据处理模型、任务调度功能在快递行业的适用性进行了理论研究。在此基础上,对HDFS(Hadoop Distributed File System)分布式存储系统以及搭建在此系统之上的Hbase数据库工作原理进行了研究。根据Hbase数据模型的特点,阐明了HDFS的数据存放、数据读写机理,建立了Hbase数据存储模型,解决了Hbase数据库物理视图与逻辑视图之间的转换关系问题,探讨了Hbase数据库数据索引机制,研究了Hbase数据库的数据模型、分布性质在快递行业的适用性。同时,以S快递河南信阳公司提供的快递面单数据为实验数据,使用搭建在Hadoop平台的Hbase数据库为实验工具,借助Hbase数据库实验数据进行存储、查询实验,借助MapReduce组件对存储的实验数据进行分析处理,对搭建在Hadoop平台的Hbase数据库在快递行业的适用性进行研究。
其他文献
新型平板显示技术是信息产业的重要支撑,近年来得到飞速发展。伴随着以智能手机、平板电脑等新型智能终端产品为代表的移动互联网时代的到来,市场对中小尺寸显示面板的需求快
随着科学技术的进步,越来越多的卫星(如TRMM)上搭载有多种高精度观测仪器,能够从各个角度实现对地气系统不同物理量的同步精确测量。基于这些仪器的综合观测结果,建立和发展多
随着我国人口老龄化速度的不断加快、老龄化规模的不断扩大,老年人的养老问题成为了我国现代化进程中的一块“心病”。由于我国人口结构变动、家庭规模变小等因素存在已久,持
紫花苜蓿(Medicago sativa L.)是一种豆科的多年生苜蓿属牧草。细胞质雄性不育是高等植物中常见的生物学现象,常用于作物的杂交育种。随着紫花苜蓿细胞质雄性不育系及保持系的发现,对其机理的探索也在不断深入。本研究选用转录组及small RNA测序技术为手段进行紫花苜蓿细胞质雄性不育系分子机制的初步研究。通过得到的结果初步揭示了紫花苜蓿不育系的分子机理,为利用紫花苜蓿不育系进行杂交育种工作
AIM:To investigate the prevalence of fatty liver discovered upon physical examination of Chinese patients and determine the associated clinical characteristics.
中外各国对历史文化的保护都形成了一系列文件 ,在许多方面都具有很高的共识。然而 ,中国历史文化以及历史街区的城市更新和历史文化保护普遍面临着几大突出矛盾 ,政府财力有
随着我国社会经济水平的发展和社会文明程度的提升,政府及社会各部门对残疾人的关注也逐渐提上日程,在残疾人事业上的财政和政策投入力度不断加大,并取得显著成效,但是仍然存在着某些问题,需要进一步来优化和解决。本文通过对长春市在社区居住的残疾人的福利发展状况进行深入研究,这不仅有利于深入了解当前长春市残疾人事业的发展现状,对推动长春市残疾人社区服务的发展和后期更好的开展残疾人社区服务工作有一定意义,研究成
新闻评论是媒体的旗帜,它代表着媒体的政治立场与观点思想,在舆论引导中应该充分发挥其强大的作用。新疆主流媒体的新闻评论仍有待于继续发展,究其原因是其仍然存在着数量不
<正> 心脏起搏器自1952年应用于临床以来,已有很大进展,尤其近十余年来,被广泛应用,获得很好的疗效。在心脏起搏器的制作方面,也不断地更新,增加了使用寿命。我们于1973年12
[目的]探讨容积二氧化碳图参数在慢性阻塞性肺疾病(COPD)病情分级方面的临床价值。[方法]对66例COPD稳定期患者和20例健康者进行肺通气功能、肺容量指标以及容积二氧化碳图测