论文部分内容阅读
随着Web 2.0的快速发展以及GPS位置采集和无线通信技术的迅猛发展,基于位置社交网络(Location-Based Social Network)出现并蓬勃发展,如 Foursquare 和 Facebook Places等等。用户在位置社交网络中对兴趣点(Point-of-Interest)(例如,电影院、餐厅等)进行签到,然后通过移动设备在位置社交网络中分享他们在物理世界的生活体验。在这个过程中,兴趣点的位置作为一个新维度将物理层与虚拟数字层之间的差距合并,从而提供了深入了解用户签到行为并挖掘用户偏好的机会。同时,兴趣点推荐作为位置社交网络的基本功能服务对于鼓励用户探索新的位置、帮助相关企业进行针对潜在用户精准营销具有十分重要的意义。因此,如何为用户提供准确的兴趣点推荐,近年来引起了越来越多的研究人员的关注。兴趣点推荐是推荐系统与社交网络的一种交叉扩展应用。将兴趣点看作传统推荐系统中的项目(电影、音乐和商品等),则可以利用传统推荐系统的技术(例如,协同过滤方法等)进行兴趣点的推荐。然而,事实却是兴趣点的地理位置作为物理世界和在线社交网络服务的链接有着其独特的属性、结构和特点,给基于位置社交网络的兴趣点推荐问题带来了如下几个方面的新挑战:1.复杂关系:兴趣点位置作为位置社交网络中的一个新对象。它促使在用户之间、位置之间、用户与时间之间以及用户和位置之间产生了新的关系,同时也使得上述对象之间的关系更加复杂。而作为位置社交网络中新的推荐场景,如兴趣点推荐,可以利用上述这些新的关系来提高推荐性能。但是,如何利用上述这些复杂关系从而产生高质量的推荐是兴趣点推荐中一项非常重要的研究任务。2.丰富的信息:兴趣点的位置信息是位置社交网络中重要的上下文信息之一。此外,位置社交网络还包含了大量不同种类不同结构的上下文信息,如用户签到位置信息、兴趣点的类别信息、用户的社交关系信息和媒体信息(例如,用户评论和视频)。这些与位置和用户相关的上下文信息从不同角度帮助了解用户签到的真实原因以及用户的真实偏好。然而,如何融合这些上下文信息从而产生高质量的推荐也是兴趣点推荐中一项非常重要的研究任务。本文针对这些挑战进行了研究,取得了一些有价值的研究成果。具体来讲,本文主要工作和贡献如下:1.已有融合地理社交信息用于兴趣点推荐的算法普遍存在以下两个问题:(1)在挖掘兴趣点地理信息时,忽视了用户对于兴趣点签到行为的个性化差异;(2)在挖掘用户间社交信息时,只关注用户显式社交信息,忽视了用户隐式社交信息。为此,本文提出一种新的个性化兴趣点推荐算法,称为GeoEISo算法。该算法在本文实现了如下三个目标:(1)基于自适应核宽的核函数密度估计方法对地理信息进行建模;(2)基于RBF核函数的SVR模型对用户显式信任关系进行建模,从而利用SVD++扩展模型融合用户显式和隐式社交信息;(3)提出一种基于矩阵分解方法来融合用户显式和隐式社交信息以及兴趣点地理信息。在两个真实数据集上的实验结果表明,GeoEISo兴趣点推荐算法具有更好的推荐性能。2.为了应对兴趣点推荐问题中普遍存在的数据稀疏性问题,现有兴趣点推荐算法研究工作主要利用兴趣点地理信息和用户社交信息来提高推荐性能,而忽视了利用兴趣点相关的用户评论信息。为此,本文提出了一种新的兴趣点推荐算法,称为GeoSoRev算法。该算法首先基于矩阵分解的主题模型挖掘用户评论文本信息从而捕捉用户情感倾向。然后,基于矩阵分解方法融合兴趣点的评论文本、用户社交信息和地理信息用于兴趣点推荐。基于两个来自真实数据集的实验结果验证了 GeoSoRev算法的有效性和高效性。3.现有兴趣点推荐研究工作大多集中在于拟合基于用户签到行为的用户偏好评分预测函数。然而实际推荐过程中,仅仅依赖于评分单一特征并不能非常准确地反映用户的偏好。在兴趣点推荐时,用户更加关心兴趣点的排序。因此,本文将排名学习领域的知识引入兴趣点推荐算法,基于贝叶斯成对排序方法,设计了一种融合地理社交信息面向排序的兴趣点推荐算法-GSBPR兴趣点推荐算法。该算法将兴趣点推荐问题转变成一个三级联合成对排序问题。基于真实数据集的实验结果表明:与主流先进兴趣点推荐算法相比,提出的GSBPR兴趣点推荐算法具有更好的推荐性能。4.现实中,由于个人位置移动模式呈现出时空序列模式特征,时间和社交信息在分析用户签到行为方面起着关键性作用。目前兴趣点推荐算法中考虑时空序列模式影响的研究工作只注重关注用户签到兴趣点序列之间的空间相关性,存在以下问题:(1)忽略了连续兴趣点推荐也是一个时间感知的推荐任务。对于相同的签到信息,用户在不同的时间偏好不同的兴趣点序列;(2)忽略了用户的社交信息对于最终推荐结果的影响;(3)忽略了用户签到数据隐式反馈属性。为了解决以上问题,本文提出了一个新的时空社交协同排序推荐算法-STSCR兴趣点推荐算法用于兴趣点推荐。该算法深入分析连续兴趣点推荐中影响用户签到行为的各个因素,基于张量因式分解框架捕获时间因素、兴趣点与用户之间的相互作用,最终实现了对于用户、用户的社交信息、兴趣点和时间的相互影响作用的细粒度建模,然后采用BPR标准优化张量分解的损失函数,拟合用户在兴趣点对上的偏序关系。此外,该算法还提出了一个新的社交感知权重效用函数区分用户与好友之间的相关性。在真实数据集上的实验结果表明:STSCR兴趣点推荐算法相比其他先进的兴趣点推荐算法具有更好的推荐性能。