基于元素链接的XML信息检索系统的研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户：eagle_19810

【摘要】

：

XML信息检索是在传统信息检索基础上发展起来的,是数据库领域和信息检索领域相结合的一门技术。研究表明,XML文档中的元素链接关系无论对元素的内容,还是结构都会产生重要影

【作者】

：

禹继波

【机构】

：

南京航空航天大学

【出处】

：

南京航空航天大学

【发表日期】

：

2010年期

【关键词】

：

XML信息检索元素链接 XML索引 Pseudo Dewey编码图型建模 Markov链用户浏览模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

XML信息检索是在传统信息检索基础上发展起来的,是数据库领域和信息检索领域相结合的一门技术。研究表明,XML文档中的元素链接关系无论对元素的内容,还是结构都会产生重要影响,从而影响XML信息检索的结果。本文主要针对XML文档中的元素链接关系,从XML索引技术、XML信息检索模型和冗余信息削减等方面展开研究。首先,提出了一种面向元素链接的XML索引技术,该索引包含两部分:文档外部链接索引和基于Pseudo Dewey编码的内部元素索引。其中Pseudo Dewey编码是一种基于schema的局部编码方式,每个元素的编码由该元素类型在schema中的位置和元素顺序等信息决定;内部元素索引本身则按照关键字类型、编码的逻辑大小等标准来组织结构。实验表明该索引具有支持元素链接、检索效率高、更新代价低等特点。其次,提出了一种基于图型建模的XML信息检索模型,该模型充分考虑了XML文档中元素链接关系对元素结构的影响;然后根据公共子序列的长度、位置和比重等因素来计算模型中上下文的相关性值,并得出该模型的上下文相关性矩阵;最后通过拓展传统向量空间算法来计算元素与用户检索语句的相关性,从而提高了检索结果的查准率和查全率。最后,建立了一种基于用户检索语句的Markov链用户浏览模型,并结合用户浏览历史记录和元素的上下文信息推导出该模型的转移概率矩阵;然后提出了一种基于结果集最优相关性的冗余信息削减技术及其贪心法优化方案,实验表明该贪心法优化方案时间消耗低,执行效率高,具有很好的实用价值。

其他文献

基于本体的移动学习系统建构与研究

随着网络技术、通信技术和移动计算技术的迅速发展，远程教育的方式也发生了日新月异的变化。移动学习作为能实现任何时间任何地点开展学习的新型学习方式，成为了远程教育研究的

学位

移动学习本体技术学习路径

赵瑞华治疗妇人情志病经验撷菁

气机不畅是妇人情志病的基本病机,肝郁、脾虚、阴阳不调、合并他病皆可导致妇人情志病的发生.赵瑞华教授治疗妇人情志病以调和肝脾、燮理气机为根本,注重健运中州、补益气血,

期刊

情志病气机不畅中医药疗法赵瑞华女性

基于社会力的拥挤人群行人运动模型研究

社会力模型能逼真的模拟拥挤人群行人运动，但也存在不足：人群挤压变形不明显、行人之间存在较大空隙、存在不合理的振荡现象。本文以社会力模型为基础，考虑到相对速度对行人社会

学位

拥挤人群行人运动模型社会力模型社会心理公共建筑设计

陈宝贵“三统一”“三精准”“三效关系”临证思维探析

陈宝贵教授在传统中医辨证论治理论指导下,结合现代医学诊疗技术,形成了“三统一”“三精准”“三效关系”的完整临证思维.“三统一”即人与自然的统一、人体整体的统一、人

期刊

整体观辨证随证施治治疗用药名医经验陈宝贵

李亚平应用蒺藜的经验

蒺藜首载于《神农本草经》,诸多古籍中有记载,是临床中常用的一味中药.李亚平教授精研中医古籍,对蒺藜的应用有独特的认识,认为蒺藜专入肝经,性平而润,理气平肝、活血祛瘀,却

期刊

蒺藜治疗应用名医经验李亚平

基于综合优先级的P4P节点选择算法

互联飞速发展的今天,P2P(Peer-to-Peer)网络已经深入到互联网生活的很多方面,网民们喜欢用它来进行交流和资源共享。随着P2P网络的规模增大,P2P流量的增长十分惊人。P2P给人

学位

P2P网络P4P节点选择Bit Torrent

真空内滤机改进实践

目前，选铜企业精矿脱水设备主要是以GN－40(使用年限10年左右）为主，它以脱水高效和过滤成本低而被广泛使用。内滤机的运转率和出力车是完成生产任务的重要指标，因此对于内滤机追求

期刊

滤机改进实践密封装置填料压盖脂润滑尾轮中空轴传动装置密封要求面接触

基于元素链接的XML信息检索系统的研究

其他学术论文