一种新的XML文档存储平台SDML的实现技术

来源 :山东大学 | 被引量 : 0次 | 上传用户:likelikeme
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自1998年W3C(World Wide Web Consortium)发布了XML1.0[1](Extansible Makeup Language)标准以来,XML就迅速显示出在数据存储、数据交换等方面的优越性,短短几年时间,XML就成为了Web上的数据表示和数据交换的标准,XML数据成为Internet上的主流数据,显露出强大的生命力。随着网络信息的不断的膨胀,如何有效地存储和管理这些XML数据,已成为当前各种网络应用面临的较为突出的问题。 XML作为一种数据的表示形式由于它可以灵活的表示各种数据,尤其是那些关系模式无法表达的复杂的数据,正在数据库及网络中的数据传输领域被广泛使用。XML文档数据库的设计和存储正受到越来越多的关注。目前关于对XML数据存储和管理的研究主要集中在使用关系数据库来存储和管理XML数据(XED—XML Eenable Database)和使用原生XML数据库(NXD—Native XML Database)来进行存储和管理两个方面。 XML文档的存储直接影响到对于它的查询效率。目前,原生XML文档数据库设计正成为数据库界关注的热点研究课题,这其中对XML文档的存储多以平面文件数据库方式存储。即XML文档多以文本方式表达,然后借助于工具软件解析文档的层次结构,并对其进行操作。直接对其存储也已经有很多这方面的研究。但他们多考虑对树结构中的节点如何进行编码,如何高效插入和遍历。这过多集中于逻辑层面上的设计。而忽略了其物理存储和实现方面的研究。对于实现中遇到的各种问题基本上没有给出相应的解决方法。尤其是遇到具有大量结构相同元素时效率明显下降。基于此,本文提出了一种高效的XML文档存储方案SDML。详细讨论了他的存储结构和实现细节。特别提出了如何解决具有大量结构相同元素的存储方法,并给出了在其上进行查询,插入,删除、文档加锁和索引维护等操作的解决方案。给出了这种结构I/O费用代价。本方案的提出主要基于作者参与开发的通用数据实验平台。 通用数据实验平台参照数据库系统的体系结构设计,采用模块化结构
其他文献
随着互联网新技术的发展,网络服务和信息交换等应用大规模出现。由于网络数据的异种性和异构性,就急需一套统一的数据表式和数据交换的标准。可扩展标记语言(XML)及时解决了
随着基因组学的不断发展,DNA微阵列技术为生命科学提供新的解决问题的思路与方法。基因表达数据是一般为矩阵形式,分析的是基因发生的改变,基因间的互相关系以及基因活动产生
随着商业银行的飞速发展,身份认证作为信息安全的第一道保障越来越重要,一个最主要的问题就是多个系统身份认证机制的集成化。目前,商业银行各种业务系统相互独立的身份认证存在
随着软件系统需求的不断增长,软件界的问题也越来越多。导致项目失败或者延期、超出预算或品质低劣的问题,被业内人士称之为“软件危机”。在软件项目开发过程中,风险是时时
语音识别技术在实验室条件下逐渐发展和成熟,但在噪声环境下的语音识别问题仍然是语音识别技术完全从实验室走入人们的日常生活的一大障碍。因此,作为人们交流时的一个重要的
随着网络的日益普及和Internet信息资源库的广泛使用,越来越多的人们把网络信息检索作为日常获取信息的重要手段。为了更准确、更有效地查找到自己所需的特定的网络信息,建立
随着信息技术和电子商务的迅速发展,人们对物流的需求日益增加,要求获得更灵活、快捷、合理的物流服务。然而,我国的物流企业各自为战、功能单一,各公司优势无法结合。现代物
随着网络和多媒体存取技术的快速发展,数字产品的分发和复制以前所未有的速度发展,但是由于数字产品易复制、易篡改的特性,数字产品的安全问题得不到保障。数字水印是通过在数字
迁移工作流是将移动计算技术应用于工作流管理的一项新技术,工作流业务过程中的活动被映射为迁移实例,多个迁移实例通过迁移和协作完成工作流过程。构成迁移工作流管理系统的三
工作流技术是实现业务过程自动化的核心技术,它具有合理利用已有资源、提高工作效率、过程自动化和流程监控等优点。Web服务是一种新的分布式应用程序,它具有互操作性强、新的