基于Hadoop的云存储系统的设计与实现

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:GYQ865739853
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会信息化的发展,互联网的使用已经非常普及。全球大数据进入高速发展阶段,随之产生的数据呈指数级增长,如何存储和分析这些海量数据已成为当前热点问题。云存储作为一种服务,被广泛应用在多个存储领域,以其良好的可扩展性、可靠性、稳定性作为海量数据存储的优秀解决方案。Hadoop作为云存储的分布式存储技术的主流项目,可以运行在低廉的硬件上,并具有可靠的容错性,正受到很多企业和科研的青睐。本文系统地阐述了一个基于Hadoop架构的云存储系统的设计与实现。并针对小文件存储问题进行原生HDFS系统改造,提出了HPM方案,在数据处理层完成了多个功能模块的设计。根据小文件的体积不均的特点,本文基于体积最优的小文件合并算法的设计,对小文件进行合并,使得均匀地分布在数据块中,充分利用数据块体积减少数据块的空白区,一定程度上减少Name Node的内存开销,其中相比于原生HDFS的内存开销降低了近95.58%。另外设计文件索引与热点缓存,是基于Ehcache的缓存预取方案。在数据写入之前对文件建立索引,以文件多标签拼接成字符串作为Row Key存储在HBase数据库中,接着通过对各种不同文件标识设计读取方式,并采用Ehcache缓存策略实现热点数据的预取和缓存,从而提高Hadoop集群的读取效率,对比实验验证了该方案比原生HDFS的读取速率提升了2.01倍左右。通过对云存储方案需求和可行性的分析,设计了云存储系统的总体架构并在此基础上进行系统的技术架构、web端负载均衡及数据库的设计工作,最后,完成系统的环境部署及系统功能的实现,主要验证了系统基于B/S模式的访问特点,实现用户管理、目录管理及文件上传、下载、共享、删除等操作。基本实现了云存储系统应有的功能和所具备的特点。
其他文献
<正>厨房中有很多美容法宝,例如吃剩下或过期的蜂蜜,就是护肤的全能高手。美国《赫芬顿邮报》7月23日载文,请美国美容专家达娜·奥利弗博士告诉你蜂蜜都有哪些妙用。1.修护发
期刊
本文对呈硬度梯度的45#钢试样的马氏硬度与维氏硬度的关系进行了试验研究,通过对其大量试验数据进行线性回归并结合现有文献建立了马氏硬度与维氏硬度、马氏硬度与洛氏硬度及
某大型商务楼裙楼结构改造施工需用新增梁柱来托换剪力墙原来承受的屋顶荷载,通过对沉降、倾斜、挠度、轴力和裂缝等结构状态参数进行实时监测,来指导剪力墙拆除切割施工的进
近几年来,随着高等教育快速发展,科教兴国战略逐步深入实施,各个高校所承担的科研项目及筹措的科研经费都有大幅增长,但同时在科研经费管理和使用上也出现不少漏洞和新的问题。特
在耗散结构和协同学的理论框架下分析科技创新团队的建设现状,从系统的开放性、发展的平衡态、非线性和涨落等方面研究人员、设备、财力、政策等组成要素之间的协同行为,系统
目的探讨VACTERL联合征畸形合并发生的模式及产前超声诊断方法,以提高VACTERL联合征畸形的产前检出率。方法回顾性分析我院畸形数据库产前超声诊断的VACTERL,联合征胎儿的临
会议