【摘 要】
:
随着XML数据的日益增多,XML已经成为了互联网上数据表示和数据交换的标准格式。同时也涌现出大量的XML数据存储方法,比较有代表性的有XML专用数据库存储、面向对象数据库存储
论文部分内容阅读
随着XML数据的日益增多,XML已经成为了互联网上数据表示和数据交换的标准格式。同时也涌现出大量的XML数据存储方法,比较有代表性的有XML专用数据库存储、面向对象数据库存储、关系数据库存储等。由于关系数据库的大力发展、广泛应用和其成熟的技术,在存储管理XML的各种可能的方式中,基于关系数据库的XML数据存储成为一种可行而有前景的方式,受到了广泛的关注。
由于关系数据库的二维平面关系表结构与XML的层次结构有很大差异,怎样在关系数据库中有效地存储XML文档,同时又能保持其结构信息和文档信息成为一个难题。为了解决这一难题,使得XML模式与关系模式之间的映射问题,成为XML文档的关系化存储技术的核心问题。
本文基于XML Schema,研究了XML Schema到关系模式的映射技术,实现XML文档在关系数据库的存储。主要内容包括:概述了现有的XML数据存储技术和基于关系数据库的XML文档映射技术,并分别对它们进行分析比较。在此基础上,提出一种基于XML Schema的关系映射方法,该方法是建立在对XML Schema中各组件的特性进行充分了解的基础上,针对不同的组件,采用不同的转化方法,同时考虑组件的语义完整性约束;在实现XML文档到关系数据库的有效存储过程中,首先将XML Schema映射为关系模式,接着将XML文档中的数据抽取出来并存入该关系模式中;本文还简单研究了XML文档的重构问题,并考虑最大限度的复原XML文档;根据本文所提出的模式映射理论,建立了一个原型系统,对基于XML Schema的关系映射算法进行了实验和验证,表明对通用XML文档的关系化存储有比较理想的效果。最后,总结了研究成果,阐明了将来的研究方向。
其他文献
医学图像的三维表面重建可为医生提供逼真的三维表面效果图,这些三维图形对医生分析病人的病情起到了很大的帮助作用。然而,由医疗设备得到的断层图像相邻两层间的距离要大于同
随着计算机网络的普及,越来越多的资源以数字形式在网络上传播,软件产品已经渗透到工农业生产、商业活动和日常生活的各个方面。随之而来的是日益严重的盗版问题。现在,各种
近年来,计算机应用正以各种方式越来越快地渗透到各个领域之中。其中以数据库,尤其是关系数据库的应用最为广泛。关系数据库以集合代数为基础,利用关系模型来建立问题和领域
粒子群优化算法(Particle Swarm Optimization,简称PSO)是一种基于个体进化与群体协作和竞争的随机搜索算法。由于其过程简单明了、易于实现、计算效率高等特点,被公认为可以与遗
随着计算机系统和网络的广泛应用,可用性和高性能成为计算机系统所追求的目标,集群技术的出现和发展很好的解决了这两个问题。集群就是由一些互相连接在一起的计算机构成的一
基因表达数据是通过DNA微阵列技术获得的关于一组基因表达过程及其调控信息的定量描述。研究基因表达数据,获取有意义的基因簇,对于研究生物现象背后的本质、遗传性疾病的诊
在如今信息过载的互联网世界中,推荐系统扮演着越来越重要的角色。根据各种网络服务平台上数字产品的特征不同,对推荐系统功能、性能上的需求也会有较差异,数字音乐产业也不
企业信息系统在适应变幻莫测的市场需求时必须能够有效的集成已有软硬件及数据资源,由于原有信息集成技术的能力不足逐步显现,使得基于ESB的企业信息集成方法与技术已成为当
Ad hoc网络是一种无中心自组织的无线网络,其不依赖基础设施,因此在军用、民用等很多领域都有广泛的应用。因为Ad hoc网络主要由一些移动便携设备组成,这些设备通常只有有限
人类社会已经步入了一个信息量高速增长的信息化时代。搜索引擎技术使得人们能够更方便的寻找信息。但是,信息的持续增长让传统的搜索引擎也显得难于处理,为了解决海量Web信