基于用户行为的个性化查询研究

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:yncai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的快速发展,越来越多的人使用互联网获取信息,互联网的信息也随着使用人数的增多而快速增长,同时信息增长的速度也更加快。从海量的信息里面,获取用户所需的信息成为信息检索领域的热点,并且由于手机应用的丰富,很多用户直接APP中获取所需的信息而不是通过网络浏览器。APP上的内容也无法被搜索引擎爬取,对大部分APP而言,站内搜索的查询方式是基于关键字来匹配结果,这种方式往往会查出大量结果,很难令用户满意,个性化查询技术是优化查询的一种方法。目前的个性化查询有了一定发展,本文在分析了之前的检索算法的不足的基础上,提出了基于用户行为的个性化查询算法和个性化的伪反馈相关查询扩展方法,并以外卖搜索为例进行了相关实验。实验结果表明,本文提出的两种算法对查询结果有明显的改善。论文的主要工作如下:首先,本文通过网络爬虫爬取了美团外卖在南昌市的外卖店铺信息和商品信息,以店铺为单位构建店铺之间的相似度特征矩阵,利用k-means算法对店铺进行聚类,并验证基于店铺相似度与基于TF-IDF特征聚类效果的好坏,实验结果表明基于店铺间相似度的特诊矩阵聚类效果比较好。在此基础上本文利用用户的使用记录来构建用户的偏好模型,这一步是个性化查询的关键一步。其次,本在在用户偏好模型基础上,构建个性化的查询算法,通过计算用户偏好相关系,以及查询词与店铺相关性,将二者结合对查询结果重排序,将排序后的前N家店铺返回给用户。并构建外卖下单虚拟平台,在此平台上进行了相关实验。并与基础查询方法和基于TF-IDF的查询方法进行对比,实验表明,本论文提出的个性化查询算法效果优于其他两种方法。最后,本文在个性化查询方法的基础上,提出了个性化的伪相关反馈插叙扩展方法。该方法将个性化的初检结果作为扩展词的来源,与原始查询词结合进行二次查询,并将二次查询的结果作为最终的查询结果返回给用户。并在虚拟外卖平台上进行相关实验。实验表明个性化的伪相关反馈查询效果要优于非个性化的伪相关反馈查询。
其他文献
为了深入研究生物质颗粒燃料的热风点火性能,总结最佳的点火控制条件,该文以PB-20型生物质颗粒燃烧器为试验装置,以直径为8mm的秸秆颗粒为试验材料,分别研究了点火丝功率、风
<正>微波炉在日常维修中,其磁控管的损坏也较多。磁控管则是微波炉的重要电子元件(即为微波发生器),管内有一个圆筒形阴极,在阴极外面包有一个阳极,而在阴极与阳极之间有一个