伪相关反馈相关论文
文档与查询之间的语义鸿沟是信息检索领域中一个挑战性的难题。伪相关反馈是解决这个问题的一个可行的办法。由于自然语言的复杂性......
处在信息时代,信息搜索成了人们生活不可缺少的部分,背后支撑的信息检索技术尤为重要。传统的信息检索模型通过匹配文档和查询中词......
检索系统是在海量信息中查找有用信息重要工具。信息检索的重要问题是文档与问句相似度的计算方法。围绕这个问题,提出了多种检......
本文的主要工作就是研究自适应信息过滤中提高模板准确性的学习算法和过滤阈值优化的新方法。 给出了一种改进的自适应信息过滤......
随着互联网技术的迅速发展,网上文本数量呈指数级增长,如何有效检索这些海量信息成为当前重要的研究课题。文本信息检索是处理海量......
随着互联网技术的飞速发展,网络已经成为网民信息分享和交流的公共平台。视频作为声音、图像和文字等信息的载体,成为广大网络用户......
随着互联网的飞速发展,互联网上的数字信息量也开始呈指数型增长,人们要从信息海洋中获取自己需要的特定信息变得越来越困难。能帮......
如今,互联网上的数据量呈指数级增长趋势,各种各样的数据与日俱增。面对如此浩瀚的数据海洋,如何从中快速、准确地获取用户需要的......
轨迹数据记录了用户移动行为,富含重要的时空信息,具有巨大挖掘价值。轨迹数据正成为各行各业争夺的重要资源,如何充分发挥轨迹数......
信息及互联网技术的高速发展,使得海量的多媒体信息在互联网上得以快速的传播并产生大量的音视频文件。如何在海量的音视频文件中......
互联网的高速发展带来了信息的爆炸式增长。如何从缛繁杂乱的信息中筛选出所需信息,是一个迫切需要解决的问题。在现有的信息检索......
微博作为一种互联网社交软件越来越受到重视,它同时具有社交网站的属性和大众媒体的属性,是一种新型的传播媒体和网络平台。人们可以......
机器学习过程中,由于训练集不完备,有必要构建具备主动学习能力的增量模型。对基于伪相关反馈的增量模型,现有的增量学习方法提出......
查询扩展作为查询优化的重要组成部分,对改善信息检索系统的性能起到了至关重要的作用。传统的伪相关反馈查询扩展方法虽然在一定......
由于用户兴趣和文献领域知识背景挖掘不充分的问题,往往检索不到满意的效果。基于这一观察,提出一种融合离线和在线知识驱动的个性......
针对现有方法建立模型效率低、语义概念间孤立和模型适应性差等问题,文章采用了基于隐含语义分析和伪相关反馈的方法完成视频语义......
在分析当前信息检索存在问题的基础上,以及简单介绍现有相关反馈和伪相关反馈的优缺点基础上,提出一种新的首页相关反馈的查询扩展......
反馈文档的质量是制约伪相关反馈方法性能的主要因素。为了提高反馈文档的鲁棒性,提出一种基于最大边缘相关的伪相关反馈方法 RMMR......
为能在搜索引擎返回的结果集上构建贴近用户意图的主题层,并在文档词与主题间建立映射,将社会化标注引入经典的LDA模型,构建一种基......
传统的伪相关反馈(pseudorelevancefeedback,PRF)方法,将文档作为基本抽取单元进行查询扩展,抽取粒度过大造成扩展源中噪音量的增加。研......
本文提出了一种基于伪相关反馈模型的领域词典自动生成算法。将领域词典生成过程视为领域术语的检索过程:假设初始检索出来的前若干......
针对查询分类问题,借助互联网中人工组织的分类网站领域URL,利用URL-key在各个类别中使用的频度,提出基于方差的领域URL-key识别方......
查询扩展是信息检索过程中重要的一步.在现有的研究中,大部分查询扩展方法都是孤立地考察每个词对查询扩展的重要性,挑选最好的几个词......
相关反馈是一种重要的查询重构技术,本文分析了两类相关反馈技术,一是按用户是否参与可分为伪相关反馈和交互式相关反馈,二是按作用于......
传统的信息检索方法通常使用基于“词袋”的文本表征模型。“词袋”模型在表征文本时存在非常明显的缺陷。文本中的词项蕴含一词多......
随着移动互联网的快速发展,越来越多的人使用互联网获取信息,互联网的信息也随着使用人数的增多而快速增长,同时信息增长的速度也......
为了适应实时在线的网络信息过滤需求,提出了一种新的自适应过滤模型。在系统的初始化阶段,运用增量学习方法对附加的少量伪相关文......
针对传统伪相关反馈(PRF)算法扩展源质量不高使得检索效果不佳的问题,提出一种基于检索结果的排序模型(REM)。首先,该模型从初检结果中......
查询扩展是在原查询词的基础上加入相关的词或者词组,以克服自然语言的“二义性”问题,改进查询意愿的描述。在概念语义空间中进行查......
如何有效的进行生物医学文献检索和信息挖掘,是计算机技术和生物信息技术研究领域中的一个经典课题。本文对生物医学文献中自然语言......
查询扩展作为一门重要的信息检索技术,是以用户查询为基础,通过一定策略在原始查询中加入一些相关的扩展词,从而使得查询能够更加......
伪相关反馈技术的性能很大程度上依赖2个参数的取值,在缺乏结果相关性评价的前提下,这些参数只能依靠经验设置.文中提出基于矩阵分解......
针对伪相关反馈模型反馈文档信息质量差和扩展词选择不适产生的漂移现象等问题,提出了一种基于约束的半监督聚类查询扩展方法。该方......
随着互联网技术的迅猛发展,人们逐渐地从曾经的信息匮乏时代步入了信息过载的时代。如何从海量信息里获取自己所需要的信息迅速成......
随着万维网信息的急速膨胀,人们需要在以几何速度增长的冗繁信息中寻找自己所需要的信息。搜索引擎逐渐成为人们日常生活中网络搜......
查询扩展是一种改善信息检索召回率的重要技术。该文根据维基百科和搜索引擎各自的优点来实现查询词的扩展,试图提高检索结果top N......
近年来,微博已经成为一种混合了社交网站的属性及大众媒体的作用的新型网络应用,在热点新闻和各类信息发布中的重要性愈发显现,并......
用图书的出版信息和用户生成的社会信息从社会媒体中搜索出相关的图书已成为信息检索系统的一个研究热点。大部分的信息检索系统都......
近年来,在互联网的浪潮之下,信息规模达到空前水平,呈现“信息爆炸”之势。如何从海量数据中,获取满足不同用户需求的信息成为当务......
随着互联网的进一步的发展和普及,微博作为一种强大有力的网络平台和社交传播媒体日益流行起来。目前风靡全世界的Twitter和国内的......
文章在传统的伪相关反馈基础上引入深度强化学习的查询扩展方法来改善信息检索中由词不匹配造成的检索效果不佳问题。选择eBay于20......
通过在查询扩展中引入深度学习框架,并结合局部和全局查询扩展模型,从而解决查询扩展中伪相关反馈引起的查询漂移问题。选择eBay于......
信息检索为人们获取网络信息带来了巨大的便利,网络上多语言信息资源的大规模存在,也使得用户对跨语言信息检索(Cross Language In......
提出一种面向查询扩展的矩阵加权关联规则挖掘算法,给出与其相关的定理及其证明过程.该算法采用4种剪枝策略,挖掘效率得到极大提高......
互联网上很多资源蕴含人类群体智慧.分类网站目录人工地对网站按照主题进行组织.基于网站目录中具有主题标注的URL设计URL主题分类......
互联网上电子信息的迅猛膨胀带来了信息过载问题,信息过滤技术能够帮助人们检出感兴趣的相关信息或者屏蔽非法信息。面对实时在线......
实体属性挖掘(slot filling,SF)旨在从大规模文档集中挖掘给定实体(称作查询)的特定属性信息。实体搜索是SF的重要组成部分,负责检索包......