海量数据存储模型的研究

来源 :无线通信技术 | 被引量 : 0次 | 上传用户：abcttf2005

【摘要】

：

随着互联网上信息量的爆炸式增长,海量网页数据的存储出现了难题。针对海量网页数据进行存储的问题,传统的集中式存储和管理方案已经难以提供高效、可靠和稳定的服务。本文设

【作者】

：

施磊磊施化吉

【机构】

：

江苏大学计算机科学与通信工程学院,

【出处】

：

无线通信技术

【发表日期】

：

2014年04期

【关键词】

：

Hadoop集群 MapReduce HBase

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网上信息量的爆炸式增长,海量网页数据的存储出现了难题。针对海量网页数据进行存储的问题,传统的集中式存储和管理方案已经难以提供高效、可靠和稳定的服务。本文设计并实现了一种针对海量网页数据进行存储的分布式平台模型。该模型利用Hadoop集群和基于HDFS分布式文件系统的Hbase数据库实现高效率地分析、计算和存储海量数据,以MapReduce计算模型和Zookeeper同步协同系统保持数据写入的高效性和一致性。最后通过实验测试,该存储模型可以克服传统的存储模型存储时存在的读写效率低、数据写入不一致的问题,同时具有良好的扩展性、可行性、稳定性和可靠性。 With the explosive growth of the amount of information on the Internet, massive webpage data storage presents problems. In response to the problem of storing huge amounts of webpage data, traditional centralized storage and management solutions have been difficult to provide efficient, reliable and stable services. This paper designs and implements a distributed platform model for mass web data storage. The model uses Hadoop cluster and Hbase database based on HDFS distributed file system to efficiently analyze, calculate and store huge amounts of data and maintain the efficiency and consistency of data writing with MapReduce computing model and Zookeeper synchronization and collaboration system. Finally, through the experimental test, the storage model can overcome the problems of low read and write efficiency and inconsistent data writing when storing the traditional storage model, and has good scalability, feasibility, stability and reliability.

其他文献

表皮生长因子受体靶向的RNA干扰在肺癌治疗中的研究现状

RNA干扰(RNA interference,RNAi)是近年来发现的一种由于mRNA被降解或者翻译沉默而引起的基因沉默的现象,并成为一种常用的研究基因功能、寻找医学顽症如肿瘤治疗方法的实验

期刊

肺癌表皮生长因子受体RNA干扰Lung cancerEpidermal growth factor receptorRNA interference

人工全髋关节置换术中应用C型臂X线机检查的临床价值

笔者自1998年1月～2006年6月,行人工全髋关节置换术153例157髋,术中应用C型臂X线机检测,效果良好.

期刊

人工全髋美节置换C型臂检测

Pillar植入术治疗阻塞性睡眠呼吸暂停综合征病人的观察和护理

[目的]探讨Pillar植入术治疗阻塞性睡眠呼吸暂停综合征(OSAS)的护理及术后随访.[方法]46例鼾症病人经我导睡眠仪(PSG)监测分为轻至中度OSAS(28例)、重度OSAS(6例)和单纯鼾症(

期刊

Pillar植入术阻塞性睡眠呼吸暂停综合征观察护理

我院器官移植中心住院患者用药分析

目的:评价我院器官移植中心住院患者用药情况。方法:利用合理用药监测系统(PASS)对我院移植中心住院患者2007年12月7日～2008年1月6日用药情况进行同步监测。结果:共监测移植中

期刊

PASS系统合理用药器官移植中心

肝干细胞的研究进展

自W ilson和Leduc等在小鼠营养性肝损伤修复机制研究中提出肝内可能存在肝干细胞的假说以来,引起人们对肝干细胞研究的极大兴趣。近年,随着发育遗传学、细胞生物学等多学科发

期刊

肝脏干细胞肝损伤肝肿瘤

慢性肾病糖代谢紊乱患者的血糖控制

糖尿病(DM)是一种全球性疾病,我国DM的发生率也随经济的快速发展而明显升高.目前,不仅糖尿病肾病(DN)成为终末期肾功能衰竭患者最常见的原因之一,其他慢性肾病(CKD)合并DM亦

期刊

糖尿病糖尿病肾病慢性肾病血糖控制

重症肺炎患者外周血细胞计数与预后

目的探讨外周血细胞计数对重症肺炎患者预后的影响.方法对呼吸内科78例重症肺炎患者根据预后分为死亡组和存活组,比较2组外周血细胞计数;采用Logistic回归模型对外周血细胞

期刊

肺炎血细胞计数预后

一种基于相似度的无线异构网络遗传定位方法

定位技术是无线异构网络的关键技术之一,目标跟踪、辅助路由、网络管理等诸多网络功能的实现都依赖于对目标位置的准确定位。本文研究单基站WCDMA与WLAN构成的异构网络中节点

期刊

无线异构网络定位方法遗传算法RSSITOA

WiMax Mesh网络中基于最少簇的中继部署算法研究

在多跳中继的Wi Max Mesh网络中,当发送功率和信道带宽为定值时,用户接入链路的速率取决于用户到中继的距离,对于接入层中继位置的设计可以提高整个网络的吞吐量和进行无视距

期刊

WiMax Mesh网络中继部署多跳簇

基于PVD隐写术的载体图像的选择研究

设计高性能嵌入算法与选择合适载体图像是提高隐写术性能的两个重要途径。基于像素差值PVD(pixel-value differencing)是一种算法复杂度低,嵌入容量大的高性能隐写算法。本文针对PVD嵌入算法,研究最佳载体选择问题。论文分析与讨论载体图像的复杂度、直方图及其平滑度等载体图像特征值,和相对熵、直方图的改变量等隐写术系统性能参数之间的关系,研究载体图像的特征值对PVD隐写术系统性能的影

期刊

隐写术载体图像图像复杂度PVD算法RS检测

海量数据存储模型的研究

其他学术论文