基于时空相关的差分隐私轨迹数据集发布方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:a62058803
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
轨迹数据对于智慧城市和“互联网+”建设有着重要作用,然而轨迹中包含了大量的个人隐私,对轨迹数据集的发布进行隐私保护刻不容缓。差分隐私作为一种定义规范、理论基础坚实的新型隐私标准,已逐渐应用到隐私保护的各个领域。现有的差分隐私轨迹数据集发布方法主要针对位置点规模较小的数据集进行保护,且没有考虑位置点的时间属性。对于携带时间属性、位置点规模较大的时空轨迹数据集发布,存在发布效率低,加入噪音数据量大的问题。本文主要针对上述问题,研究位置点的时间属性对差分隐私保护下时空轨迹数据集发布结果可用性的影响,并提出差分隐私时空轨迹数据集混合发布方法(Hybrid Release Method to Spatio-temporal Trajectory Dataset via Differential Privacy,HRST-DP)。主要研究内容如下:(1)提出时空轨迹数据集聚合度的定义来对数据集的稀疏性进行评价,分析时空轨迹数据集聚合度对差分隐私发布结果准确性的影响;提出时空生成轨迹集的定义,并对差分隐私时空轨迹数据集发布问题进行形式化描述。(2)针对原始时空轨迹数据集聚合度低导致发布结果相对误差大的问题,提出时空轨迹数据集聚合算法(Spatio-temporal Trajectory Data Aggregation Algorithm,STAA),STAA算法首先将时空相似的位置点聚合到同一簇中,然后用簇中心点替换轨迹中的原始位置点,间接达到相似轨迹合并的目的,从而提高数据集的聚合度。(3)利用前缀树模型发布最终满足差分隐私的时空轨迹数据集,并针对时空轨迹数据集的高维性导致噪音前缀树中节点多,加入噪音量大的问题,提出基于节点聚合重构的噪音前缀树构建算法(Noise Prefix Tree Build based on Node Aggregation and Reconstruction,PTBAR),PTBAR算法包括节点聚合算法Node-Aggre和节点重构加噪算法Merge-Noise两部分。Node-Aggre对噪音前缀树同一层中分配到相同隐私预算的节点按照计数值进行近似的聚合排序。对于聚合后的树节点,以簇为单位,调用Merge-Noise算法对计数值相似的相邻节点进行合并重构,并对重构后的粗节点添加噪声。Merge-Noise通过多次迭代的方式增加节点合并概率,可有效的减少噪音数据加入量。(4)通过真实轨迹数据集,将本文提出的HRST-DP方法与现有方法进行对比实验,验证STAA算法和PTBAR算法中Node-Aggre、Merge-Noise方法的有效性和可用性。
其他文献
水下目标探测跟踪系统相当于自主水下机器人的眼睛,是水下机器人能在水下自主活动不可或缺的一部分。一个准确可靠、实时性较好的探测跟踪系统对能否顺利开展水下工作起着至
基因的表达过程受到多方面的调控,内源基因编码的非编码单链micro RNA(mi RNA)在动植物中的调控作用的重要性已经被广泛认识。本课题组在前期工作中,采用高丰度的cre-MIR1162
社交网络、网络购物与人们生活日益密切,人们通过网络购物占日常购物的比重在逐日增加。商家为了增加网络中销售额开始在社交网络使用博客、微博等方式推广自己的产品,同时人
偏振光导航是一种新型的自主导航方式,其具有不向外辐射能量、抗干扰性强、定向误差不随时间累积等特点。偏振光导航不仅可以与里程计组合组成自主导航系统,也可以与GPS,MIMU
多智能体系统由于其工作效率高、潜在应用领域广泛等优点,受到了越来越多国内外专家学者的关注,针对多智能体系统的研究也已经成为控制研究领域的一个重要分支。而对多智能体
轨迹数据记录了用户移动行为,富含重要的时空信息,具有巨大挖掘价值。轨迹数据正成为各行各业争夺的重要资源,如何充分发挥轨迹数据中蕴含的丰富知识,是数据挖掘研究领域的前
在测控领域中,测试对象复杂、测试参数众多,对测试速度、测试精度要求较高;传统的单机单参数手工测试已不适应生产力的发展,要求能够对被测对象进行自动化测试与控制。为满足
近年来,随着无线局域网研究的深入和移动通信技术的发展,正交频分复用技术凭借其频谱利用率高、系统复杂度低、带宽扩展性强等特点,在4G组网、WLAN中广为使用。随着智能手机
在几十年以前,就已经有人提出了逐次逼近型的模数转换器结构(即SAR ADC),但是近些年人们对它的关注度越来越高。这是因为同其他ADC相比,SAR ADC的芯片面积小,结构简单,模拟模块
通信信号调制分析技术是非合作通信领域的关键技术,在电子侦察、通信对抗、频谱监测等方面有着重要的应用价值。经典的通信信号调制分析研究大多假设环境噪声服从高斯分布,但