面向小文件的云存储系统关键技术研究与实现

来源 :浙江大学 | 被引量 : 0次 | 上传用户：NobelHsu

【摘要】

：

存储是云计算的一块基石。云计算环境下，存储面临着诸多挑战，如海量数据要求系统容量足够大、数据增加快要求系统有非常强的扩展性、高可用性要求系统低延迟、热点数据现象要求

【作者】

：

张启飞

【机构】

：

浙江大学

【出处】

：

浙江大学

【发表日期】

：

2013年期

【关键词】

：

云计算云存储系统 Chord算法 Trie树去中心化

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

存储是云计算的一块基石。云计算环境下，存储面临着诸多挑战，如海量数据要求系统容量足够大、数据增加快要求系统有非常强的扩展性、高可用性要求系统低延迟、热点数据现象要求处理高并发请求等。特别是存储小文件时，元数据请求数量将是存储大文件时的成千上万倍。主从架构系统中元数据服务器将成为系统扩展的瓶颈。本文针对海量小文件的存储，主要取得以下几项研究成果:　　(1)提出了一个基于P2P的面向小文件的云存储架构。创新地引进了一个中心路由节点，中心路由节点保存资源与节点的映射关系，使资源查询平均跳数从0(log(n)）降到0(1)。客户端通过预取中心路由节点数据得到文件与机器的映射关系表，进一步减少了一个网络来回的时间开销。实验表明新架构下，文件尺寸为1K～20K时读取时间约是HadoopHDFS系统的1/(500～200);文件尺寸为160K～1M时读取时间约是HadoopHDFS系统的1/(110～22);实验证明本系统读写吞吐量峰值约为是TFS的1.5倍，系统扩展性远优于TFS。　　(2)由于系统的中心路由服务器存在单点故障问题，为了增加系统的可用性，本文提出了一种基于Trie树索引的快速构造算法，该算法利用索引字符串的统计信息，跳过了串行构造算法中的重复比较，实验表明快速算法时间优于串行算法和Aoe的DAT算法;　　(3)本文对类GFS(GFS-like)架构中元数据服务器进行了“去中心化”的研究，将元数据从元数据服务器移动到数据节点上，针对元数据和数据的一致性问题，提出利用主数据节点维护数据一致性的方法，同时提出了主节点选择协议;本文提出并实现了数据节点上小文件存储优化方案，将所有小文件合并为一个大文件，利用B+数对小文件进行索引，这样提高了数据节点的存储效率。

其他文献

移动社交网络中暂态社交特性的建模研究

近年来，随着移动智能终端设备的普及以及社交网络规模的高速增长，为了满足日益增长的用户需求，越来越多的科研工作者开始投入到移动社交网络的研究热潮中。在移动社交网络中，节点

学位

移动社交网络演化模型预测方法暂态度中心性

基于条件概率神经网络的人脸年龄估计

学位

树突细胞算法在线分析组件的研究及其应用

随着现代网络技术的不断发展,微博、淘宝和支付宝等的广泛使用,网络安全问题日益成为人们关注的焦点问题,也是研究者们急需解决的问题。而传统的防火墙对于入侵攻击行为只是

学位

树突细胞算法入侵检测系统在线分析分片危险理论

群体动画虚拟环境中分层次路径规划方法研究

近年来，借力于计算机三维辅助设计制作方法的不断进步，动漫产业已由一个新兴产业发展成为一个庞大的、成熟的高收益产业。研究如何利用计算机图形学、人工智能、虚拟现实等相关

学位

群体动画路径规划环境建模萤火虫算法

推荐系统中融合社交关系和隐式反馈挖掘的研究

随着信息技术和Web2.0的快速发展，信息的爆炸式增长造成了信息过载的现象。推荐系统是克服信息过载问题的有效工具，它通过分析用户的历史行为挖掘用户兴趣，从而主动给用户推荐能

学位

推荐系统社交关系隐式反馈协同过滤数据挖掘

基于社会自私性的DTN路由算法

Internet取得了巨大的成功，在其之上运行的TCP/IP协议已成为互连网络的事实标准随着科学技术的发展，各种新型网络开始出现，例如传感器网络，深空通信网络等，这些网络以高链路延迟，高

学位

DTN社会网络社会自私性

WebGIS防汛监测系统

近年，由于频繁出现的台风和高强度降雨，城市内涝问题日益突显。城市的防汛防涝工作已经引起了各方面的高度关注，防汛建设对国民经济发展的影响越来越大。根据当前防汛基础设施建

学位

网络地理信息系统防洪防汛实时监控离线地图可视化

程序流程图结构化验证与实时检测

随着模型驱动开发技术的不断发展，模型驱动在软件开发过程中起着越来越关键的作用。基于模型驱动的开发技术，能够使得开发者从整体逻辑框架上去设计软件系统，而不需要关系具体的

学位

模型驱动程序流程图结构化验证实时检测算法文字提示

基于着色Petri网的柔性工作流研究与应用

工作流面临着执行过程中的重组与节点的重复执行，传统静态工作流技术不能实时的更新与缺乏柔性的特性就与实际需求变更产生了矛盾，一种正确的灵活的可适应动态变更的工作流建模

学位

柔性工作流流程建模运行控制Petri网

基于改进的局部保持投影的人脸识别

人脸识别是最主要的生物特征识别方法，也是模式识别的热点研究课题。自上世纪70年代，已经提出了大量的算法。目前越来越多的研究表明，人脸图像可能分布在高维观测空间的非线性流

学位

人脸识别局部保持投影张量最大间距准则

面向小文件的云存储系统关键技术研究与实现

其他学术论文