信息检索查询性能预测

来源 :江苏大学 | 被引量 : 0次 | 上传用户:yuandatoy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
查询性能预测的目的是为了在缺少相关性判断信息的条件下评估一个检索系统针对于一个特定的查询返回的结果的有效性。查询性能预测在信息检索领域有着许多的应用,如查询优化,提高检索的一致性和分布式信息检索。这就是近几年这个问题在信息检索领域受到相当大的关注的原因。查询性能预测也被称为查询困难度预测。  查询性能预测方法大致可以分为两大类:检索前预测方法和检索后预测方法。检索前预测方法在查询提交给检索系统之前预测查询的性能,它们主要使用了在索引阶段收集到的查询词项的统计学特征。因此,这类方法通常计算非常快速,但是一般没有检索后预测方法准确。检索后预测方法在查询提交给检索系统获得查询结果列表之后预测查询的性能。这类方法通常更加复杂,因为需要分析检索后的结果文档。  针对近几年的查询性能预测研究,论文主要做了如下工作:  (1)论文提出了一种综合考虑排序结果列表得分量度和差异度的SMV方法来评估查询的性能。实验中使用了6个不同的TREC测试集,并将SMV查询性能预测方法与3种先进的预测算法进行了比较。实验结果表明SMV查询性能预测方法非常地有竞争力。与其他3种查询性能预测算法采用两两对比的方式,SMV预测算法在更多的数据集上预测效果表现地更好。  (2)针对许多基于得分分布的预测算法都需要提前设定一个固定的k值的情形,论文提出了一种动态选取截断参数k值的方法。这种方法可以根据不同的查询设置不同的k值。  (3)论文提出了3种基于检索前的查询性能预测算法,同时使用了3种检索前方法与之进行了对比实验。实验结果显示,相对于原先的3种预测方法,本文提出的方法性能要好一些。  目前,查询性能预测已经被认为是信息检索系统最重要的功能之一。
其他文献
网络业务爆炸式增长和高带宽需求业务的大量涌现,使得光网络成为了下一代核心传输网基础。目前,光网络技术的快速发展,特别是密集波分技术以及新型光纤技术的不断进步,光网络
P2P(Peer to Peer)网络与传统的C/S(Client/Server)网络应用模式相比具有可扩展性、鲁棒性、容错性和自组织性等很多优点。近年来,在协同计算、分布式存储方面均有较为广泛的应用
生物信息学是以计算机为主要工具,对以指数增长的生物数据进行处理的一门交叉学科。序列比对是生物信息学的基本研究方法,通过序列比对可以推断基因的结构、功能和进化关系。
随着芯片技术的不断发展,超大规模集成电路(Very Large Scale Integration,VLSI)在生产中起着越来越重要的作用。通道布线作为VLSI的一个关键环节,其性能优化和改善对提高VLSI芯
进化测试是近年来兴起的非常重要的一种自动化测试数据生成技术。进化测试的主要思想是将测试数据的生成问题转化成为进化搜索问题,从而实现测试的自动化。进化测试利用进化
随着我国经济的飞速发展、汽车保有量的激增,随之产生的各类道路管理问题日趋严重,智能交通管理系统应运而生,在此背景下,作为智能交通管理系统核心的车牌识别系统也越来越受到关
工作流管理系统的主要目标是通过合理地调用和分配有关的信息来协调业务过程中的各个活动,以促使业务目标的高效实现。在计算机和网络使用越来越广泛的今天,工作流管理系统正吸
随着网络应用的发展,XML已成为互联网各种应用中信息交换的事实标准。随着XML技术的普及,越来越多的应用程序不再是仅仅把XML作为应用程序之间数据交换的手段,同时也将XML作
随着信息技术的迅猛发展,人类社会正进入信息时代,信息已成为人类宝贵的资源,特别是计算机网络已经渗透到社会的各个领域,信息越来越成为一种战略资源,人们的决策越来越依赖
异构数据源的集成是建立综合电子信息系统的重要目标。目前的异构数据源集成方法主要面向异构数据库,在实际应用中,用户常常需要对现有系统的各类异构业务数据进行综合分析和