基于语义相关性的XML关键字查询的研究与实现

被引量 : 0次 | 上传用户:gsy2589
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在网络技术飞速发展的同时,web上涌现出的数据也呈指数级增长.XML逐渐成为互联网上描述和交换信息的标准格式,广泛应用于电子商务、数字图书馆等应用实例和产品.XML文档集检索的有效性成为研究一个重要方向.XML关键字查询近年来成为XML数据检索的一个研究热点.相较于XML查询语言,如XQuery等,XML关键字查询有其独特的优势.用户不需要额外学习复杂的查询语言,也不需要深入了解查询信息的内部底层结构,只需要提供相关内容的关键字就可以实现数据的检索.同时XML关键字检索以元素为粒度进行,结果只返回包含用户提供的全部关键字的XML文档片段,提高了检索的速度.论文的主要研究内容如下:将XML树中实体节点和属性节点类比于数据库中E-R模型的实体和属性,提出实体子树的概念,并将实体子树做为语义相关单元的基本元素.定义了标识节点语义信息的语义三元组,从而将关键字和特定的环境语义关联在一起.用户提前确定关键字的语义,可以提高查询结果与用户查询意图相匹配的几率.将关键字分为主关键字和从关键字,在查询过程中过滤从关键字,仅保留主关键字可以减少查询的范围,提高查询的效率.在XML关键字查询过程中定义了关键字匹配节点间的语义相关性,通过寻找关键字的相关语义单元提高了查询结果的语义相关性.在上述内容的基础上描述并实现了基于语义相关性的关键字查询算法.由于关系型存储具有严密的理论及成熟的实现技术,XML信息的后台存储利用关系数据库来实现.最后将基于语义相关性的关键字查询方法和MLCA方法的查询结果进行比较.实验表明,基于语义相关性的关键字查询方法更好地表达了用户的查询意图,在查询的有效性和查询效率上都有较大改进.
其他文献
本文首先对形象及其发展过程进行了理论研究,以此为基础界定了本文的企业形象概念。并以此定义为前提条件,本文研究了企业生命周期的发展情况,根据企业发展过程与企业形象发
本文对民族共同体的发展阶段、社会主义民族关系的特点、主体民族的提法、历史上民族关系的主流和特点等问题提出了自己的看法。
随着互联网技术及各种应用服务的迅猛发展,现有互联网网络构架的一些原始设计缺陷逐渐显露出来,IP地址身份与位置双重特性正是其中之一。身份与位置分离的研究已成为当前互联
农村基础教育是当前整个教育工作的“重中之重”。加强农村初中学校管理,控制农村初中学生厌学,是推进素质教育,加强农村基础教育的重要环节。本文试图对当前农村初中学生厌
本文对薄壳山核桃果用林基地星天牛危害情况进行了调查,并开展了防治试验。结果表明,薄壳山核桃星天牛危害程度与树的径级有关,混交林在一定程度上能降低星天牛危害率;用8%绿
信息网络技术与传统的零售业态相结合,产生了新型的网络零售业。本文分析网络零售业的优势与发展现状,以及制约我国网络零售业发展的因素,并对其经营策略进行了探讨。
目的为了解三峡坝区蓄水后自然环境的改变,尤其是鼠类栖息和生存环境的改变,当地居民及后靠移民的居住和生产环境的改变,及流行性出血热自然宿主鼠类的密度、种群分布和带毒
目的:探讨不完全川崎病(KD)的临床特点。方法:对16例不完全川崎病的临床资料进行回顾性分析。结果:不完全KD患儿的临床特征较少,但其实验室诊断指标却有过度表达。16例不完全
由于人类活动与自然环境的冲突,地球环境遭到破坏、资源面临枯竭、人居环境日益恶化。近年来,面对现实环境的压力,人们重新审视人与自然、建筑与自然环境的关系,生态学和可持
糖尿病肾病(DKD)是糖尿病主要微血管并发症,是导致终末期肾病(ESRD)的主要原因之一,DKD治疗难度大,其防治是当前研究的热点。新型降糖药物,钠-葡萄糖协同转运蛋白2抑制剂(SGL