论文部分内容阅读
搜索结果的评价是搜索引擎评价的核心组成,对于评估用户体验、迭代改进搜索引擎具有重要的意义。目前,搜索结果的评价主要是对搜索结果的内容进行评价,忽略搜索结果的展示方式或者假定采用了相同的展示方式。作为搜索结果主要组成的文本搜索结果,长久以来面向查询产生和展示,展示方式基本固化为标题、查询词和URL的突出显示(突显,高亮)。这种方法在当前互联网环境下面临一些挑战:(1)搜索用户不断增多,搜索场景和任务多样,以关键词为主的查询往往较短或有歧义,基于查询词突显的搜索结果展示往往与用户的真实查询信息需求之间存在偏差;(2)用户期待搜索引擎能够“所答即所问”,目前面向查询的展示方式与用户期待获得知识的目标之间存在偏差;(3)相同、单一展示方式下的搜索结果内容评价,与用户对搜索结果的整体认知存在偏差。针对这些挑战,本文主要研究搜索结果的展示和评价方法,从满足用户信息需求的角度评价搜索结果的展示效果,自动优化搜索结果的展示方式。本文开展了三个方面的具体研究:关键词查询的搜索结果展示和评价、问题类查询的搜索结果展示和评价以及搜索结果展示效果自动化评价方法。前两个研究使用了用户调查和用户实验两种方法,定性和定量分析了当用户提交查询为关键词或一个问题时,用户对于结果展示的偏好选择以及展示方式对于用户搜索行为的影响。我们采用机器学习算法实现了面向用户查询意图的结果展示,可以用于优化目前面向查询的搜索结果展示方式,也可为搜索结果展示效果评价提供一个对比的“黄金标准”。相关研究结果扩展了已有搜索引擎结果评价的研究,加深了我们对于搜索结果展示方式对用户网络搜索行为影响的理解。在此基础上,最后的研究实现了搜索结果展示效果的自动化评价,可以大大减少评价所需的人力和经济成本,缩短评价的反馈周期。