个性化k-匿名模型研究

被引量 : 3次 | 上传用户:ken112233
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术的发展为机器学习、知识发现提供了新的技术支撑,也在一定程度上对个人隐私带来了相应的威胁。虽然数据拥有者在对数据进行共享和发布前会采取一定的措施来隐藏源数据中的直接标识个人身份的数据信息,研究人员却发现通过链接多个公开的数据源,个人隐私信息还是会发生某种程度的泄漏。为了避免个体的隐私数据受到如前所述的链接攻击,Sweeney提出了k-匿名模型。实验证明k-匿名模型能够有效地解决数据发布与共享中由链接所产生的身份泄漏问题,但同时也发现,k-匿名模型对敏感属性信息还缺乏相应的保护机制。为了更好的发挥k-匿名模型在隐私保护方面的功效,研究人员提出了许多改进的匿名模型与方法,虽然这些方法使得隐私保护效果得到了不同程度的提升,但在实现敏感属性有针对性的个性化隐私保护方面仍存在许多不足之处。在对当前已有的k-匿名算法及模型进行分析和研究的基础上,本文对k-匿名模型进一步做了改进,开发出了一个新的基于个性化隐私保护决策度的k-匿名粒化模型及算法。论文的主要研究内容如下所述:第一,针对现有的匿名化隐私保护技术在进行数据发布和数据共享前欠于考虑敏感属性个性化隐私保护决策度的问题,结合实际应用中不同个体对不同敏感属性或同一敏感属性不同敏感值的隐私保护需求的不同,结合粒计算理论,提出了一种基于个性化敏感属性隐私保护决策度的个性化k-匿名模型即个性粒化k-匿名模型,又可称为( g ,α)k-匿名隐私保护模型。并将该模型应用于含有一维敏感属性的数据发布实例中,实验证明,该模型能有效的提高隐私保护精度,避免了高隐私保护需求的数据出现隐私泄露、低隐私保护需求的数据过分匿名保护的现象。第二,对于含有多维敏感属性的数据,本论文采用多层粒化方法。首先根据待发布数据中的多敏感属性个性化隐私保护决策度的不同进行聚类粒化,使每个粒空间中的数据具有尽可能相似的个性化隐私保护需求。然后再对形成的粒空间中的数据选择相适应的粒化和匿名参数,进行个性粒化k-匿名。文中给出了相应的隐私保护决策度定义和相应的粒化匿名算法。实验结果表明,与传统k-匿名方法相比,该算法能够有效减少数据匿名化处理所带来的信息损失,提高对多敏感属性的匿名化隐私保护精度。第三,给出了实现个性粒化k-匿名的泛化匿名算法,通过分析当前匿名泛化算法的不足,将聚类分析的思想引入到( g ,α)k-匿名模型中,遵循相同粒空间中各元组间的距离尽量小,也就是内部要尽量相似;而不同的粒空间中的元组间距离要尽量大,即外部各粒空间尽量相异的原则,论文重新定义了各种距离计算公式、衡量信息损失的计算公式和相应的聚类粒化的泛化算法,并且对新算法的正确性和算法执行的时间复杂度做了相应的分析,实验结果验证了论文中所提出的个性粒化k-匿名模型及算法是实现个性化隐私保护的一种有效的模型工具。
其他文献
作为具有批判精神的启蒙史学家,吉本在书中有许多新观念、新思想。吉本把孟德斯鸠等先辈开创的启蒙史学发扬光大,理论之光烛照了史学的黑暗。能寻找历史事件的因果关系,找出
目的探讨按疾病诊断相关分组(DRGs)视角下控费政策对医疗服务的影响。方法以“嘉定区域疾病诊断相关分组医疗服务管理系统”为研究平台,对某二级医院2017—2018年住院患者DRG
土家族是我国历史悠久的民族,摆手舞是土家族的奇葩。它不仅具有仪式性的功能,同时作为土家族的共享文化,蕴含了艺术、教育、历史记忆和族群认同的文化内涵。摆手舞在酉阳被
目的通过背部小切口组织块种植法构建兔VX2肾癌模型,评价背部小切口组织块种植法构建兔VX2肾癌模型安全性和可靠性,行射频消融治疗后检测其外周血细胞因子浓度变化,探讨射频
农村基层党组织公信力是新时期农村基层党组织建设的重要组成部分。农村基层党组织公信力的巩固与提升是增强党的执政能力和稳固党的执政地位的基本要求。本文首先概括了农村
改革开放后兴起的中国新闻改革浪潮一直延续至今,学者李良荣指出:“新闻改革至今,经过了增量的大发展阶段,现在已进入盘活存量的攻坚战,党报改造、时政新闻突破以及制度创新是
随着隧道建设的日益增多,由于环境的限制,出现了许多复杂环境下的隧道工程。为确保复杂环境下隧道的爆破施工安全,结合隧道的建设,对隧道爆破近区振动进行测试研究,揭示隧道
2010年8月14日强降雨过程导致汶川震区映秀镇红椿沟泥石流暴发,泥石流堰塞堆积体堵断岷江主河道,导致河水改道冲入映秀新镇,引发洪水泛滥;造成映秀镇13人死亡、59人失踪,受灾
我国文化体制改革经历了30多年的变迁,文化体制改革所取得的成果有目共睹,人民群众深切感受到了文化发展的成果,但是不可否认,我国的文化体制改革仍然不够彻底,改革过程中存
中药物种的多样性和多元性,中药成分的丰富性和复杂性,中药配伍的灵活性和多变性,中药信息资源的急剧增长和海量资料的挖掘和整理,中药研究现有实验技术的局限和不足等等,决