【摘 要】
:
近年来,XML作为互联网上数据表示和交换的标准格式日渐受到人们重视,XML查询也由此成为研究热点。对于大量的没有专业背景的用户,传统的结构化查询方式已不再适用,关键字查询
论文部分内容阅读
近年来,XML作为互联网上数据表示和交换的标准格式日渐受到人们重视,XML查询也由此成为研究热点。对于大量的没有专业背景的用户,传统的结构化查询方式已不再适用,关键字查询无需用户掌握复杂的查询语言和数据库内部的模式信息,因而获得了较大的发展空间。但是,关键字查询在查询意图的表达能力上天生不足,查询处理只能尽量返回相关结果,加上可能出现的查询语义不明确和查询空间规模庞大等情况,会造成查询结果数量众多,如何合理有效地组织查询结果成为了一个亟待解决的问题。本文对XML关键字查询结果的多样化问题展开研究,查询结果多样化就是按某种原则将查询结果分类组织,从而达到方便用户查找的目的。主要工作如下:1)将XML数据所描述的不同对象表示为包含独特语义信息的实体,并对这些实体进行合理的语义分组。通过分析实体中最具代表性的特征信息,综合定义一个计算实体间语义相似度的公式,然后计算任意实体间的语义相似值,根据选定的聚类算法将语义相似的实体聚集为同一分组。2)提出一种按查询结果所属中心实体的语义类别进行行结果多样化的方法。以往的多样化方法大都关注查询结果的匹配模式,该方法避开了这种繁杂的处理,从语义层面出发,定义查询结果所属中心实体的定位法则,依据前期实体的语义分组,将所属中心实体在同·语义分组的查询结果归为一组。该方法不仅充分考虑了不同用户的查询需求,使查询结果分组更加清晰合理,而且将大部分牦时的工作放在线下进行,有效缩短查询处理时间。实验结果表明,语义相似度计算公式能有效地反映不同实体间的语义距离,我们提出的基中心实体语义类别的查询结果多样化方法较以往的多样化方法在有效性、效率和可扩展性方面都有较大提高。
其他文献
在21世纪,IT行业中的云计算领域有了快速的发展,同样,在IT行业的影响下,DNA科技也取得了快速而有效的发展。因此,本文的主要目标是将云计算和DNA相结合实现一个完整的系统。 本
传感器网络节点硬件失效、监测环境恶劣、网络拥塞等客观问题,使得传感器网络数据的不完全性成为必然。不完全数据给数据融合、数据存储和数据挖掘等技术带来严峻考验,传统针
复述是自然语言表达中存在的一种普遍现象,即相同语义的不同表达方式。复述识别即判别两个给定语言表达式或者模板是否表达相同或相似的意思,其研究结果可广泛应用于自然语言
具备精确控制与传感能力的自治汽车的出现,给安全驾驶带来了新的希望。当前存在的人工智能技术已经能有效的解决自治汽车在开放道路中行驶问题。但面对情景复杂、拥堵较严重、
网络最大流问题是网络流理论的重要组成,是介于连续型和离散型问题的分界线上,可作为特殊的线性规划以及组合优化问题。其在现实的实践应用中,例如现实中的信息流、交通中的
近年来,随着电子商务的迅猛发展,形形色色的Web服务大量的涌现,服务提供商也不断将现存的Web服务整合起来形成新的、增值的服务,去不断的满足用户的需求。不过,用户在各种需
随着互联网的迅速普及与广泛应用,网络的安全问题也日益严重。近年来,作为维护网络安全的一项主要技术,入侵检测技术得到了广泛的关注。但是,现有的入侵检测系统还存在很多的问题
格问题在现在的公钥加密方案中扮演了相当重要的角色,格问题的计算难解性为许多创新性的公钥加密方案提供了理论依据。模形式算法作为新的随机算法解决欧几里得空间内的最短
聚类分析是一种最为广泛应用的数据挖掘技术,其原理是先对数据对象进行聚类处理,然后对其结果进行分析,试图从中找到隐含的具有实用价值的信息。聚类就是将大量混为一团的数据对
随着ARM处理器性能不断提升,同时又兼顾低功耗、体积小的特点,嵌入式计算密集型应用越来越多。鉴于计算密集型领域系统的可靠性要求高,因此如何设计高可靠性嵌入式系统成为一