论文部分内容阅读
近年来,随着移动手机等智能终端的普及和移动计算技术的发展,位置服务(Location Based Service,LBS)越来越受到人们的青睐,它给人们带来方便的同时,也增加了隐私泄露的风险,攻击者可以很轻易地从位置信息中提取出用户的家庭地址、健康状况、收入等信息。目前用户位置隐私泄露的途径主要有两种:(1)某些组织或机构为了科研目的公开用户的位置数据,攻击者获取这些数据后,采用大数据等相关技术,挖掘出用户的隐私信息;(2)用户在接受位置服务时,受到攻击者攻击,导致隐私泄露。因此开展LBS中用户隐私保护技术的相关研究具有重要意义。
LBS中用户隐私主要包括位置点隐私和轨迹隐私,与后者相比,前者研究起步早,技术更加成熟,研究难度更小(轨迹中位置点之间具有较强的时空关联性,需要考虑的因素更多)。因此本文研究重点在于如何高效地保护用户轨迹隐私,具体来说本文的研究内容和创新点如下:
(1)提出了基于轨迹泛化的分层参考系差分隐私保护系统,解决轨迹发布过程中用户隐私泄露的问题,与前人的工作不同,本文首先使用基于希尔伯特曲线的空间划分技术对原始轨迹进行泛化处理,降低轨迹分布的稀疏程度。然后使用多个参考系(而非单个)捕捉不同速度用户的运动特性。接着使用一种全新的基于二项式分布的修枝策略,对前缀计数树进行修枝操作,最后提出了方向加权采样算法,恢复轨迹的运动方向,提高数据的实用性。实验结果表明该系统在保护用户轨迹隐私的同时能够保证数据的实用性。
(2)提出了基于位置服务的语义感知合成轨迹隐私保护系统,保护LBS中用户的轨迹隐私。将真实轨迹隐藏在合成轨迹中,使得攻击者难以分辨是实现隐私保护的一种常用方式,难点在于如何确保合成轨迹和真实轨迹似是而非,从而达到迷惑攻击者目的。前人的研究大多忽略了语义,粒度和方向性等因素,攻击者在掌握一定的背景知识的前提下很容易分辨出真实轨迹。本文采用新提出的基于位置语义的聚类算法对轨迹数据集中的位置点进行聚类处理,并设计了相应的指标来衡量合成轨迹和真实轨迹之间的语义相似度,粒度相似度,方向相似度。考虑到系统效率,我们采用分阶段筛选的方式避免了大量不必要的计算。由于合成轨迹上的虚假位置点是数据集中真实存在的,合成轨迹数据集和原始轨迹数据集具有相似的统计特性,所以该算法获得的合成轨迹可以代替真实轨迹发布,降低用户隐私泄露的风险。实验结果表明采用该算法获得的合成轨迹在语义,粒度和方向上与真实轨迹高度相似。
LBS中用户隐私主要包括位置点隐私和轨迹隐私,与后者相比,前者研究起步早,技术更加成熟,研究难度更小(轨迹中位置点之间具有较强的时空关联性,需要考虑的因素更多)。因此本文研究重点在于如何高效地保护用户轨迹隐私,具体来说本文的研究内容和创新点如下:
(1)提出了基于轨迹泛化的分层参考系差分隐私保护系统,解决轨迹发布过程中用户隐私泄露的问题,与前人的工作不同,本文首先使用基于希尔伯特曲线的空间划分技术对原始轨迹进行泛化处理,降低轨迹分布的稀疏程度。然后使用多个参考系(而非单个)捕捉不同速度用户的运动特性。接着使用一种全新的基于二项式分布的修枝策略,对前缀计数树进行修枝操作,最后提出了方向加权采样算法,恢复轨迹的运动方向,提高数据的实用性。实验结果表明该系统在保护用户轨迹隐私的同时能够保证数据的实用性。
(2)提出了基于位置服务的语义感知合成轨迹隐私保护系统,保护LBS中用户的轨迹隐私。将真实轨迹隐藏在合成轨迹中,使得攻击者难以分辨是实现隐私保护的一种常用方式,难点在于如何确保合成轨迹和真实轨迹似是而非,从而达到迷惑攻击者目的。前人的研究大多忽略了语义,粒度和方向性等因素,攻击者在掌握一定的背景知识的前提下很容易分辨出真实轨迹。本文采用新提出的基于位置语义的聚类算法对轨迹数据集中的位置点进行聚类处理,并设计了相应的指标来衡量合成轨迹和真实轨迹之间的语义相似度,粒度相似度,方向相似度。考虑到系统效率,我们采用分阶段筛选的方式避免了大量不必要的计算。由于合成轨迹上的虚假位置点是数据集中真实存在的,合成轨迹数据集和原始轨迹数据集具有相似的统计特性,所以该算法获得的合成轨迹可以代替真实轨迹发布,降低用户隐私泄露的风险。实验结果表明采用该算法获得的合成轨迹在语义,粒度和方向上与真实轨迹高度相似。