论文部分内容阅读
推荐系统通过收集用户相关信息,过滤掉大量无用的信息,向用户提供潜在的感兴趣的内容。基于兴趣点的推荐系统的推荐算法主要考虑了用户对兴趣点的偏好,来自用户好友的推荐和地理位置上的影响三个方面的因素。其中用户对兴趣点的偏好可以利用用户的兴趣点(POI,Point of Interest)签到历史来描述,使用协同过滤找到对兴趣点偏好类似的用户,并根据这些高相似度的用户提供兴趣点;利用共同好友的比例和共同签到POI的比例来描述用户和用户之间的好友度,并以此为基础向用户提供来自好友的推荐;最后地理位置对推荐POI的影响也同样重要,人们总是倾向于到附近的POI签到而忽略更远即使远处的POI对用户更有吸引力。推荐系统在收集用户信息用作推荐的同时,有可能会产生用户个人敏感信息的泄露。现存在来自两个方面的潜在隐私暴露危险,一是由于POI信息的精确化导致用户在POI签到之后分享签到会立即暴露用户精确的地理位置信息,第二是即使用户在选择隐私签到而不选择分享此次签到,而用户好友中潜在的攻击者可以根据推荐系统的推荐结果,反向推导出用户的POI签到信息。针对这两种攻击方式,本文分别提出一种隐私保护算法:1)将每个POI精确的地理位置信息模糊成虚拟圆,真实的POI可能存在于该虚拟圆内的任意一点。本文先详细介绍了现有文献中针对地理位置隐私提出的隐私保护算法<k,s>-Privacy,并详细分析了<k,s>-Privacy算法的优缺点。然后提出了<r,h>-Privacy算法,并从理论上证明了该算法的有效性。2)在推荐算法计算用户之间的好友度时,使用基于拉普拉斯机制的差分隐私向计算结果中加入适量的噪声,使得各个参数之间的变化更加平滑,平均。然后从理论上证明了噪声的加入保护了用户的隐私。最后本文将两个隐私保护算法加入到推荐系统中作为一个整体进行理论分析,给出最后隐私保护程度的公式。然后进行了大量的对比实验,实验结果表明,隐私算法的加入在很大程度上保护了用户地理位置和签到信息的隐私信息,同时对推荐算法的有效性影响微乎其微。