论文部分内容阅读
近年来,多轮次、交互式的探索式信息检索已经成为人们信息获取和信息交互的主流模式。然而,学术界对这种全新的信息检索模式认识还不够深入,相关研究还比较薄弱。为了解决这些问题,本文开展了一系列研究工作:首先,对探索式信息检索模式下的用户相关性判断理论进行深入理解。为此,本文开展了两方面的研究:首先,基于微软必应搜索引擎日志,探究了探索式信息检索中的多维度相关性理论。分析了用户在相关性判断时对不同决策维度的关注程度;其次,针对相关性判断理论开展了一系列用户实验,来探究了用户在相关性判断过程中是否存在非经典现象(宏观类量子现象)。第二,提出了基于子空间的探索式信息检索模型。首先,基于子空间的多维度兴趣建模。经典的用户兴趣建模方法中,忽视了用户兴趣的多维度特性,为了解决这个问题,本文利用一个基向量建模一个兴趣维度,多个基向量共同构成用户的兴趣子空间。在必应搜索引擎日志数据上验证了该模型的有效性;其次,基于子空间的多维度相关性建模方案。该方案中,每一个决策维度表示为一个标准基向量,7个决策维度共同构成一个子空间。每个检索文档对应一个文档多维度子空间。每个用户对应一个多维度决策子空间。用户决策子空间对文档子空间的测量概率值,可以用于文档排序。第三,提出了基于量子干涉的探索式会话搜索模型。在非经典相关性判断理论探究部分指出,用户在相关性判断过程中存在一定的量子干涉现象。受这个现象的启发,本文进一步提出了基于量子干涉理论的探索式信息检索模型。在该模型中用户的信息需求同时受显式信息需求(当前查询词)和隐式信息需求(基于用户背景知识的扩展词)的影响。最后,面向探索式会话搜索的量子语言模型。用户在信息探索过程中的信息需求受到上下文信息的影响,并随着信息探索的深入呈现出明显的动态演化特性。为了建模这个现象,本文提出了面向探索式会话检索(Session Search)的量子语言模型。相比经典方法,本文模型可以更好的建模语义的演化。综上所述,通过本文的研究将加深对用户信息探索机制的理解,并为信息检索领域的发展提供了新颖的思路,具有非常重要的科学意义。