基于云计算的RDF数据存储系统的研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:DK7531672
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义网的不断发展使得RDF数据存储系统成为一个重要的研究课题。传统RDF数据存储系统在互联网数据爆炸式增长的趋势下遭遇难题,存储能力和查询响应性能都已不能满足用户日益增长的需求。研究人员开始将目光转向云计算领域,云计算具有的海量数据存储和计算能力被认为是解决海量RDF数据存储难题的一个适宜方案,该方面的研究尚处于起步阶段。本文以海量RDF数据存储系统的设计和实现为目标,对RDF数据存储模型和查询方案进行研究,提出适合云计算环境下的RDF数据存储和查询方案。合理的RDF数据存储模型对于提升RDF数据管理和查询性能具有重要作用。本文在分析现有RDF数据存储模型优缺点的基础上,提出基于有序二叉树的RDF数据存储模型。该模型不仅考虑RDF数据在自身结构方面的属性,而且融入云计算环境下数据存储和处理的特点。该模型在保证RDF数据查询响应效率的同时有效减少了存储开销,且能平滑应对RDF数据快速增长所带来的影响。在RDF数据查询方面,本文通过研究并行计算框架MapReduce的运行机制,结合RDF数据存储模型的特点,以查询性能最优化为目标,提出查询任务生成算法,并证明该算法可有效提升查询响应效率。本文在该算法的基础上,进一步讨论基于有序二叉树的RDF数据模型的特点,给出具体的RDF数据查询响应方案。与传统RDF数据查询方案相比,该方案充分发挥云计算在数据处理方面的优势,有效提高RDF存储系统的数据查询效率。本文最后针对所提出的RDF数据存储模型和查询方案设计了原型系统,并通过实验验证存储模型和查询方案的有效性。
其他文献
现实中的很多问题可以转化为数据挖掘中的数据分类问题,这使得数据分类技术的应用领域十分广泛,例如商业保险、网络测量、气象预报、生物信息等。然而,随着信息技术的不断发展,各
移动机器人对工作环境地图信息的获取与更新是移动机器人在环境中正常工作的重要前提。距离网格地图作为描述环境信息的一种地图表示方式,是概率网格地图的重要补充,能够提供比
面向服务的架构(Service-Oriented Architecture,简称为SOA)是一个新兴的软件工程范例,用来开发动态演进的Web应用。服务的提供者和服务的使用者可以通过公共的服务注册机构
现实生活中存在着很多不平衡类数据分类问题,同时计算机和互联网技术的快速发展,使得现实生活领域的数据膨胀速度异常迅猛,因而大数据时代的不平衡学习面临着更为严峻的挑战,如何
数码照片和视频数据的急剧增长需要既能支持速度快又能支持内容形象化浏览的表达技术。随着图像文件数量的爆炸式增长,管理大量图像的内容的能力已成为一项关键技术。  一
目前国内外各个城市都在积极构建智慧城市应急指挥平台,但盲目无序的重复建设无法保证平台功能的完备性、通用性和可扩展性,本文将通过对于大量平台应用实例的分析,从领域工程的
随着网络和存储技术的不断发展,越来越多的数据呈现出数据量大、维数高等新的特点。这些海量的高维数据包含更加丰富信息的同时,也带来了如维数灾难、计算量大等问题,对数据
当前全球化竞争不断加剧,企业要寻求新的发展,必须专注于自己的核心业务,将自己擅长的方面发挥到极致;同时,企业对于自己不擅长的业务可能需要借助于其他企业的制造服务和能力
钻孔柱状图、勘探线剖面图等是地质工作者经常使用的基础性、先导性图件。它们是由各种花纹图案、曲线、文字等基本符号构成的,不仅能够清晰的表达地层岩性、地层特征,而且能够
网络时代涌现了大量与个体相关数据,即微数据,微数据对趋势分析,疾病预测以及经营决策具有重要的意义,因此很多组织开始收集和发布一些微数据,如医院会发布患者的医疗数据用