查询接口集成问题的多目标优化模型及求解算法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:cairinga
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DeepWeb是指隐藏在Web数据库中而不能被传统搜索引擎索引到的那部分内容的集合。对于特定领域的Deep Web,不同的站点会提供不同查询能力的查询接口。集成查询接口可以达到访问同一领域所有资源的目的。集成查询接口主要有模式匹配和模式集成两部分,其中模式匹配问题已经得到了广泛研究。本文对查询接口集成问题中的模式集成问题进行了分析研究。由于现实中的查询接口结构各异,使得在集成查询接口时无法得到满足所有需求的结构。基于满足多数需求的原则,本文在集成查询接口时采用频繁使用的查询接口结构。为了得到结构良好且语义全面的查询接口,本文针对查询接口集成问题中的模式集成问题提出了两类新的多目标优化模型,并对每个模型给出了求解算法。在第一个模型中,用有序树表示查询接口,可以充分体现查询接口所蕴含的结构信息,并且根据查询接口的有序树给出了一类新的结构约束和顺序约束。集成的查询接口应该集成那些在查询接口频繁使用的结构,因此,查询接口集成问题可以转化成在所有查询接口中挖掘频繁结构的问题,即在所有有序树中挖掘频繁子树。最后,以极大化叶节点个数和频繁子树的频繁度为目标,建立了一个多目标优化模型,并且给出了求解该模型的频繁子树挖掘算法。用多个领域的查询接口数据进行实验,并对实验结果进行了分析和评价,实验结果表明了算法的可行性和有效性。但是当集成结构差异很大的查询接口时,利用此模型不能够得到理想的集成查询接口。针对第一个模型的不足,本文提出了改进的模型及算法。首先,根据查询接口的结构,将查询接口的有序树转化成结构矩阵;根据该结构矩阵给出了度量两棵有序树的结构相似程度的计算方法;根据所有查询接口中的频繁结构构造了一个用于参考的理想有序树。然后,根据所有查询接口的顺序约束将所有的属性排序,基于此排序给出了衡量查询接口属性排序好坏的标准。最后,通过优化集成的有序树与理想有序树的相似度和集成有序树中的叶节点的排序,对查询接口集成问题建立了一种新的多目标优化模型。针对该模型,设计了一种合并树算法进行求解。最后,数据实验证明了改进模型的合理性和有效性,并验证了算法的稳定性。
其他文献
机会网络是一种不需要源节点和目的节点之间存在一条完整的链路,利用节点移动带来的相遇机会实现通信的自组织网络。机会网络中,节点的移动等原因导致网络间歇性连通甚至不连通
无线传感器网络由传感器节点组成,节点之间通过路由进行数据的传输。然而,传感器节点微小,易受资源约束,因此建立能量高效的路由协议显得十分必要。地理位置路由协议利用位置
随着现代计算机技术、通信技术及互联网技术的迅速发展,电子商务等领域正面临海量的流式数据。同时,由于数据产生的随机性和数据收集的不完全性,数据采集过程中产生了大量的不确
嵌入式系统领域的高速发展,给嵌入式处理器的设计带来了多方面的挑战,嵌入式系统开发已开始向高度并行化、高实时性和可扩展方向发展。堆栈式处理器具有硬件支持的堆栈、简单的
数字签名作为网络环境中手写签名的电子模拟可以解决信息传送过程中的否认、伪造、篡改等问题。1996年,Mambo,Usuda和Okamoto等提出了代理签名的概念,代理签名可以很好地解决数
无线传感器网络中,传感器节点的能量、通信、计算能力都有一定的局限性,如何使节点间通过相互作用自组织协作地发挥整体作用,设计能量高效的拓扑、路由等方法自组织以延长网
分布在监测区域内的传感器节点采集业务数据,通过无线传感器网络反馈给管理者,但如果没有地理位置信息这一切都将是徒劳的,因为管理者无法知道需要采取措施的具体地点。优秀
目前,水资源紧缺已成为许多国家或地区农业发展的障碍,在农业生产中,如何有效地利用水资源将是各国研究者的重点研究课题。土壤墒情是指土壤的含水量情况,表明了土壤的水分分布状
近邻规则是模式识别、机器学习、数据挖掘中广泛使用的一种基于样本实例的分类方法,该算法通过从训练集中寻找与待分类样本最近的样本来确定其类别。然而近邻规则的一个最大的
入侵检测作为一种主动防御技术已经是现代计算机网络安全系统不可或缺的组成部分,一直是现代网络安全领域研究的热点。支持向量机技术一直是入侵检测领域的重要研究内容,但是基