论文部分内容阅读
XML(eXtensible Markup Language)是继HTML之后发展起来的一个重要的Internet技术,它的格式简单,自我描述能力强,实现了内容、结构和表现三者的分离,适合于数据的表示和交换,已成为Web上数据表示、集成和交换的新标准。随着Web应用的迅猛发展,XML数据量与日俱增。为了有效地加工、分析和处理XML数据,国内外学者已经提出了各种XML数据的存储管理技术。由于关系数据库是目前最成熟的一种数据管理技术,在存储和管理XML数据的各种方式中,基于关系数据库的XML数据存储和处理技术显然是一种可行而有效的方式,并在学术界受到了广泛的关注。然而由于复杂的树形XML文档和简单平坦的关系型数据库表结构之间固有的不匹配,使得XML到关系型数据库的映射实现十分困难,因此成为当前的一个热门研究课题。论文对XML技术出现的背景、基本内容、特点作了简单介绍;详细阐述了XML与关系数据库的关系、当前网上发布数据所遇到的问题、使用XML带来的好处以及建立XML-RDB转换机制的必要性。论文所做的主要工作是:对当前已有的XML文档的关系存储策略进行了深入地探讨,详细阐述了各种存储策略的优点、缺陷、适应性及性能。研究表明:目前提出的几类典型的XML-RDB映射策略都有其局限性,其中存在的共同问题是只注重结构映射,而忽略其中的约束关系,从而导致语义约束信息的丢失。据此,本文提出了改进的基于DTD的映射策略,该映射策略在实现对XML结构完整映射的基础上进一步实现了对DTD中语义约束信息的完整映射与存储。Java是Sun Microsystems公司开发的面向对象程序设计语言。Java具有独立于操作平台、网络编程功能强大等特点。其提供的JDBC、JDOM、JAXP等JavaAPI使Java处理XML数据游刃有余。可以说Java是目前公认的处理XML的最佳语言。本文结合Java技术部分实现了所研究的映射策略。