论文部分内容阅读
XML(eXtensible Markup Language)是继HTML之后发展起来的一个重要的Internet技术。已经成为Internet上数据表示和交换的新标准。随着Web应用的迅猛发展,XML数据量与日俱增。为了充分发挥XML这一新技术的潜能,XML文档的有效存储就成为了急需解决的关键问题。关系型数据库凭借强大而可靠的数据管理服务,成为了解决这一问题的重要途径。然而由于复杂的树形XML文档和简单平坦的关系型数据库表结构之间固有的不匹配,使得XML到关系型数据库的映射实现十分困难,因此成为当前的一个热门研究课题。 论文中对当前已有的XML文档的存储映射策略进行了深入地探讨,详细阐述了各种存储映射策略的优点、缺陷、适应性及性能。在此基础上设计并实现了一个在关系型数据库中存储查询XML文档的全面、通用的X-R原型系统。 在X-R原型系统中映射策略的选择是通过对输入的XML Schema添加标注来实现的,然后对添加了标注的XML Schema进行解析,从而得到相应的关系模式;与此同时映射信息被保留在映射知识库中;文档分割导入模块根据映射知识库的信息将文档进行有效地分割,产生相应的表中的记录;查询转换模块也是通过访问映射知识库的信息来完成XML查询到SQL查询的转换。各功能模块之间相互独立。标注的设计考虑到不同的映射策略,通过添加不同的标注,X-R原型系统可以使用不同的映射策略,甚至可以扩展到将来提出的新的映射策略。考虑到各种应用类型,X-R原型系统中给出的标注可以表示边表、基本内联、共享内联、混合内联等映射策略,这些策略基本上可以满足各种应用的需求。X-R原型系统可以使用不同的关系型数据库作为后台数据库,具有很好的可移植性。 整个系统的设计立足于通用、灵活、易于使用、可移植并且可扩展。论文的最后,以UDB为后台数据库对X-R系统进行实例测试和验证,结果很好。