隐私保护中K-匿名化问题的研究与改进

来源 :重庆大学 | 被引量 : 0次 | 上传用户:llljjjxxx7
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在科学领域与信息技术不断地迅速进步的近些年来,信息共享与资源互利已经越来越受到人们的各种关注。与此同时,这些信息资源给人们带来各种生活中的好处,也带来了人们隐私数据信息泄露的危险。保护人们的隐私信息问题已经成为大众关注的一个焦点,也是数据发布处理研究中值得研究探讨的一个重要课题。在数据发布过程中,如果仅仅只对可以明确确定用户身份的标识符进行删除或者加密,隐私保护效果并不好,攻击者仍然可以通过利用发布数据集中的准标识符属性与外来数据集合进行联合推演,使用多个数据集的链接操作,从而推算得到个体希望被保护的隐私数据信息。K-匿名化技术是在微数据发布之中一种非常重要的隐私保护方法。可是对于在多属性集合上获取最优K-匿名化是一个NP-难问题,所以对K-匿名化的主要研究集中在:如何使发布数据集合匿名化操作控制在比较合理的时间复杂度之中,同时能够获得较高的匿名化程度。论文全面分析了目前已有的各种K-匿名化算法,并且总结出这些方法所存在的优点和缺点。针对这些问题论文的主要工作如下:①论文提出了多维映射分治的K-匿名化算法。该算法建立了新的多维到单维映射模型,并且记录其中的二种重要信息:在对每个单维进行映射得到的不同单维点的个数Pro以及每个不同单维点所对应的多维点的个数PPA。该算法采用了新的信息依赖量来度量数据信息的变化程度,降低了匿名化后的结果集中信息损失度。该算法可以在多项式的时间复杂度内获得较高匿名化程度,提高了K-匿名化算法的实际应用能力。②论文提出了K-匿名化增量更新策略。对于频繁变动的数据发布过程,该策略使用阀门值来维持数据集的相对稳定。对于增量更新时间,该策略通过对增量数据进行定位操作来实现局部更新方法,降低时间开销。对于信息损失量,该策略考虑到邻居集合中的相似集合对增量数据的信息关联度,把局部更新范围锁定在相似集合之中来来提高结果集的匿名化质量。这样保证了数据集能够在可以接受的更新时间中,重新达到K-匿名化效果。③论文分别在实验数据集合与真实数据集合上进行了多种对比实验来验证算法的可用性和高效性。实验结果表明:多维映射分治的K-匿名化算法可以得到较高的匿名化程度,且时间性能可以接受;提出的增量更新策略对于现在已经存在的技术是高效的,具有较好的数据安全性能。
其他文献
近年来,随着数字媒体技术的迅猛发展和信息量的急速膨胀,在大规模科学计算可视化、军事仿真、虚拟现实、工程设计、展览展示和数字影院等诸多应用领域,人们对显示技术的要求
现代制造业竞争日益激烈,旧的生产模式已经无法适应现代化生产的要求,大规模车间调度问题的研究已经成为当前的热点。但是车间制造系统内容复杂、范围广泛,很多领域的研究还很薄
当前,节能减排是时代的主题。随着社会经济的发展,IT行业已经逐渐渗透到了社会建设的各个层面,各个行业,成为其他行业发展的基石和依赖。工T行业蓬勃发展的同时,其能源消耗的
在信息化大浪潮席卷全球的今天,互联网获得迅速发展。网络信息已经应用在国家和社会的各个部门,人们在进行资源共享的同时,也感受到信息安全问题日益突出。如何保证网络信息安全
字符串相似性匹配是计算机领域最基础的技术之一,被广泛应用于网络安全、信息检索等领域,同时还被广泛应用于生物学信息处理,文本词根识别等应用。然而随着网络发展的日新月
无线传感器网络作为一种从现实物理世界获取信息的手段,受到越来越多的重视,事件检测则是无线传感器网络的重要应用之一。考虑到无线传感器网络自身能耗受限和容易受环境影响
近年来,无缝针织工业在世界范围内发展迅速,随着市场的变化,企业在设计针织物的时候,希望可以找到更快的设计方式,设计出适应市场需求的产品。传统上,新产品在设计时需要多次
随着计算机科学技术的高速发展,三维模型因其较二维图像更为接近现实、更符合人类视觉习惯和更生动直观的立体效果,广泛地应用于虚拟现实、文物考古、医疗成像系统以及影视游
随着科技的发展,信息技术已经深刻的影响着人类的方方面面,而数据海量化给存储技术带来了巨大挑战。相比传统的存储系统,分布式存储系统通过利用大量的小型服务器甚至个人PC
农村农产品卖难问题一直阻碍着农村经济发展,而城市农产品买难也日益凸显,为了克服双方的障碍,本文工作的主要目的是为农民设计农产品电子商务概念和交互原型,以期让农村的农