基于NoSQL构建半结构化数据方法的研究与应用

被引量 : 0次 | 上传用户:thiscf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web网络的快速发展,数据形式开始发生变化。传统的文件、关系型数据库等不同的数据存储方式对这一变化起到的一定的推动作用,但又渐渐不能满足日益增长的数据处理要求。按照数据结构划分,数据大致可以分为三类:(1)松散式数据:类如声音、图片等保存在传统文件中且没有严格结构的数据;(2)高度结构化的数据:这类数据具有高度的结构化,比如存储于传统关系型数据库表格中的数据;(3)介于前两者间的半结构化数据:这种数据隐含着部分结构或者不稳定的结构,但是又不如经过建模并存储于关系型数据库数据表中的数据具有高度的结构化。对于Web网络中的半结构化数据,研究人员提出了多种的描述理论和方法,相关的数据库存储技术也日益发展。其中,XML等交换数据格式的发展更是推动Web半结构化数据的应用与发展。同时,RDF作为语义网络的标准资源描述框架,其三元组模型为描述Web网络中的半结构化数据提供了一种很好的简单理论模型。另外,NoSQL作为一种自由模式的存储及管理方式,弥补了传统关系型数据库的不易水平扩展等缺点。本文研究的主要内容是如何对Web网络半结构化数据进行动态化的描述与存储。文中首先对Web网络中的半结构化数据的各种描述方法和存储方式进行了概述与研究,并指出其中主要面临的问题。论文的主要研究成果和创新点有如下几个方面:(1)提出RDF-JSON语义化描述方法:通过研究Web网络中半结构化数据的特点,结合JSON数据格式和RDF资源描述框架,并考虑实际工作应用中的数据形式,提出RDF-JSON这种描述Web网络中半结构化数据的方法。这种方法可以很好地兼容传统JSON数据,同时又可以很好的描述其数据的语义化。(2)利用MongoDB数据库实现动态化存储:分析和总结数据的动态化特点,并利用MongoDB数据库中自由存储模式的特性,实现数据的动态化存储。(3)提出多文档的存储方式:对存储数据进行预操作,进而提出多文档的存储方案,并建立相应的索引,从而提高数据的检索速率。(4)构建分享数据的应用。
其他文献
当前,高中英语学困生问题日渐突出。由于高中生学习英语的基础学历不完善、兴趣不浓厚、方法不科学、归因不合理,以及社会、学校和家庭等方面的各种消极影响,导致了高中英语
目前英语词汇总量已有数百万个,是世界上词汇量最大的语言,根据社会、科技前进而创新、延伸。但在英语教学中词汇教学最为难题一直困扰着教师们,因此,初中英语词汇教学变成大
历史文化村镇是重要的文化遗产和社会经济发展载体。对全国350处历史文化名镇名村空间分布规律及其与区域经济、旅游发展水平的相关性进行分析;结合历史、地理、社会、文化等
<正>1984年创立于中国青岛的海尔是全球市场份额第一的大家电品牌。海尔在全球范围内建立了29个制造基地,8个综合研发中心,19个海外贸易公司,全球员工总数超过6万人。目前,海
由于墙体及室内目标的存在,穿墙雷达回波信号中包含许多多径分量,导致在成像后图像中存在许多幻影分量.在传统的穿墙雷达成像及预处理中,将多径分量视为杂波和干扰分量,并提
由于图像在拍摄过程中光源不足等原因的影响,难免会产生低质量的图像,为了改善这类图像的视觉效果,提高图像的质量,我们需要对这类图像进行一系列的增强处理。我们通常可以根
伴随电子商务、电子政务等一系列事务信息化的春风,卫生事业的信息化在近两年也如雨后春笋般迅猛发展。在政府大力推进卫生信息化进程当中,医疗机构、卫生部门、计算机技术领
恩格斯在马克思墓前的讲话中提到:马克思一生中有两个重大发现,即唯物史观和剩余价值理论。而马克思的世界历史理论就是在其创立唯物史观的过程中形成的,它建立在对早期资本主
随着经济全球化的深入发展和中国的迅速崛起,中国与世界的交流越来越频繁,口译在这一过程中发挥着重要的桥梁作用,它渗透了社会生活的方方面面,在政治、经济、文化等领域的重要性