基于关键字的XML查询

来源 :山东建筑大学 | 被引量 : 0次 | 上传用户:shifter_2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML已成为一种重要的数据存储方式,如何对其进行查询是当前一个研究热点。目前主要有两种查询方法,一是使用结构化查询语言XPath, XQuery等工具,但用户需要知道这些工具的语法规则和数据的底层结构,适用于专业用户。二是利用关键字查询,用户只需要输入关键字即可获得查询结果,适用于广大的普通用户。研究工作者对XML关键字查询进行了深入的研究,但是还存在以下的问题:1.只局限于对单个XML文档进行关键字搜字,而没有涉及到存储于关系数据库中的XML数据。2.对XML关键字搜索后的结果没有做缓存,如果存在大量重复查询,则浪费系统资源。3.没有和网页搜索引擎相结合,忽略了用户对查询结果评价的重要性。论文针对上述问题展开了研究,并实现了一个XML关键字查询原型系统--WXKS系统。论文首先介绍了XML关键字查询方面的知识,包括XML基本概念、XML规范和标准、XML树型结构、Dewey编码、LCA、XML路径模式以及结构化查询语言言相关的知识。然后对WXKS系统做了详细的介绍,WXKS系统的特点是,以存储在关系数据库中的XML数据为数据源,实现查询结果缓存,查询结果不做删减,产生所有的以LCA为根的XML片段,然后以网页的形式,类似于Google,百度,将所有可能的结果呈现给用户,由用户选择自己需要的结果,然后对结果进行评价,并将评价结果反馈给系统。当用户第一次对某个关键字序列进行查询时,系统会将查询的结果以一定的格式缓存于数据库,根据RANK和排序机制对数据库中的结果顺序进行调整,当下一次用户查询同一个关键字序列时,直接从数据库中得到相应的结果,不再进行XML关键字查询的过程,节省了查询时间。最后,对WXKS系统进行了实验,实验结果表明,WXKS系统较好地解决了上述问题。
其他文献
CT(Computed Tomography)技术自出现以来,以其所具备的高密度分别率、能够提供完整的三维信息、显示扫描断面角度多样化等优点,被广泛用在医学诊断、工业检测、安保检测、航
医学图像分析处理在临床诊断和治疗中起着越来越重要的作用。近年来,细胞活性分析成为该领域研究的重要课题。该课题主要研究内容是对显微图像进行分析,判断细胞活性,并进行
近年来,数据挖掘技术成为数据库和人工智能等领域研究的热点课题,不仅引起了学术界广泛关注,而且也引起了产业界的高度重视。频繁模式挖掘是数据挖掘中非常受关注的一个课题,
近些年,随着对于CAD等三维模型重用需求的不断增强,三维模型检索技术的研究越来越重要。同时,三维模型数量的剧增,也推动了该领域的研究。基于语义的三维模型检索是当前的研
随着互联网的发展,Web中蕴涵海量呈指数级增长的各类信息,历史学专家的研究途径不再局限于封闭的数据库,而是借助搜索引擎在Internet上寻找所需要的史学信息。但是,网络中的
近年来,随着管道运输的大量应用,管线使用时间的增长,再加上施工过程中存在的缺陷、环境的腐蚀以及人为破坏,各种管道事故时有发生,对人们的生产生活产生了巨大的潜在威胁。
目前,很多在网格上面执行的大规模的科学应用都被表述成复杂的工作流应用;在过去的几年中,网格工作流的研究已经逐渐的成为网格应用中最为重要的一部分。工作流被定义成为一系列
银行系统在业务管理过程中,发布并积累了大量的内部文件,这些文件都是员工进行日常查阅、操作、参考的重要依据资料。传统的文档分散的存放在各个独立的计算机系统的文件夹中,相
近年来随着经济发展与社会进步,车辆的数量不断增加,车流量也随之不断提高,对交通基础设施建设、调度与管理造成了一定影响,人们在享受交通便利的同时,也面临各种问题,需要建
传统的路面养护技术效率低且耗费的材料多,为了回收利用废旧沥青的同时提高道路再生效率,路面冷再生技术发展迅速。   论文立足于863课题子项目《沥青路面全厚度再生快速修