论文部分内容阅读
互联网信息量的急速增长使得人们淹没在信息的海洋中。尽管搜索引擎为用户提供了便捷的信息检索服务,但搜索引擎召回的成千上万的结果仍需要人们花费很大的精力与时间去浏览符合自身兴趣的信息。因此,从用户与搜索引擎的交互信息中挖掘用户偏好并为用户提供个性化的检索服务具有十分重要的意义。在系统分析了偏好挖掘的国内外研究现状的基础上,综合用户的显式反馈信息和隐式反馈信息实现了基于足球领域信息的用户偏好信息挖掘。针对偏好挖掘的实时性要求,通过对用户的检索信息进行语义分析确定用户检索会话的边界,以会话为单位获取隐式反馈信息为偏好挖掘提供实时的用户行为数据。对用户反馈信息进行分析,提取其中的偏好标签和偏好动作并将其描述为标签权重有向图,为偏好模型构的建提供数据。基于足球领域知识设计了分层权重无向图用户偏好模型,为用户偏好建模奠定基础。考虑到不同的偏好动作所代表的喜好程度不一样,对不同的偏好动作赋予不同的权重。结合历史偏好信息进行实时偏好挖掘并引入了时间衰减因子,将当前未出现的偏好信息的权值进行衰减,描述用户偏好的变化过程。将偏好挖掘算法应用于搜球网,为搜球网用户提供个性化的视频检索与视频推荐服务。实验结果表明,基于分层权重无向图模型的偏好挖掘算法能很好地从用户反馈信息中发掘用户的长期、中期以及短期的偏好信息。相比于原始的检索系统,基于用户偏好的个性化检索结果排序和视频推荐中起到了很好的效果,提高了搜球网的用户体验。但系统目前仅仅考虑文本查询信息,尚未考虑用户提交的检索图片这一偏好信息来源。同时在偏好分析时未考虑偏好标签的修饰词对偏好挖掘的作用与影响。这两方面的内容将是未来研究的重点。