抵制敏感属性相似性攻击的隐私保护方法研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:suibiannicheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化时代的快速发展,数据挖掘技术在人类生活中被广泛应用。数据挖掘即从微数据中提取隐含的、未知的和潜在有用的数据信息,进行数据发布和共享,为各种组织机构之间的科学研究工作提供极大便利。同时,由于人们对自身隐私的关注度不断提高,数据发布不仅要保证数据的可用性和实时性,而且要避免个体受到泄露隐私的危害。通过对现有众多隐私保护匿名模型的研究分析,发现已有的匿名模型大多都忽略敏感属性值之间的语义相似度,会遭受相似性攻击,导致隐私泄露,威胁个体安全。因此,本文针对现有匿名模型存在的不足展开了一系列的探究,具体工作为:(1)提出(p,k,d)-匿名模型,该模型能够防止敏感属性受到相似性攻击。由于Sensitivep-k-匿名模型不涉及敏感值的语义分析,容易遭受相似攻击,本文给出一种能够避免敏感属性相似性攻击的保护方法来解决存在的问题。提出的新模型是在发布表里任一等价类符合k-匿名的基础上,通过d来约束敏感值的语义相异程度,用p来控制每个等价类中敏感值满足d-相异程度的个数,使同一类内敏感值具有明显的差异性,减少隐私泄露风险。同时为提高数据质量,该模型采用基于距离的度量方法划分等价类。(2)提出面向多维敏感属性相似性攻击的(l,m,ε)-匿名模型,其中m为敏感属性的维数。现有的匿名模型大多面向单一的敏感属性,并且不能直接适用于多维敏感属性上,但是发布的数据中往往含有多个敏感属性,多维敏感属性相似性攻击问题也大量存在。为解决这个问题,在上一个工作的基础上,提出(l,m,ε)-匿名模型,该模型能够灵活设置每一维敏感属性的d-相异程度,然后计算出m维敏感属性的综合相异程度e,使发布表中每个等价类在敏感属性上至少存在l个满足综合相异度为e-相异的敏感值,抵制相似性攻击。为实现该算法采用KACA聚类方法生成等价类,提高数据可用性。本文研究隐私保护匿名技术,对现有匿名模型进行了详细分析和改进,通过实验结果分析证明:本文算法能够有效抵制敏感属性相似性攻击,并且在隐私保护程度和数据可用性上都有显著提高。
其他文献
目的:进行两项独立的Meta分析,来进一步探讨程序性死亡配体1(Programmed death ligand 1,PD-L1)在胃癌中的预后作用及其与胃癌临床病理特征的关系(Meta分析-1),以及PD-L1表达水平对抗PD-1/PD-Ll治疗的影响(Meta分析-2)。方法:截至 2018 年 12 月 1 日,从 PubMed、Web of Science、Embase 和 Cochrane
随着计算流体动力学(CFD)分析技术日渐成熟,被广泛应用于核反应堆安全分析与工程设计中,在燃料组件的热工水力性能研究等各个方面体现出了重要意义。针对燃料组件的热工水力
结合黔中水利的施工实际情况,对工程中应用的拱圈和拱上施工技术进行分析,对其重点施工环节的施工工艺进行了详细阐述。实践证明,该技术的应用对于提高渡槽施工质量起到了促
本文综合采用文献调研和内容分析方法,对国外8所卓越科研项目资助机构的专家管理内容进行调研,结果发现在专家遴选要求、专家职责、利益冲突及管理和保密性措施等方面,由于各机
为研究混凝土三通管内水流流速及压强的特性,针对实际工程中常见的混凝土三通管,运用CFD计算方法及流体动力学软件FLUENT进行数值模拟,采用Navier-Stokes方程和连续性方程求
生物组织内异质体的定位及检测一直是生物医学光子学领域的研究热点,准确定位异质体的位置是光学成像方法应用于临床检测的前提。目前,国内外研究学者通常选用多光源-多检测
近年来,植物病毒病害在农业生产过程中给农产品质量和数量带来了巨大损失,其中以马铃薯Y病毒(Potato virus Y,PVY)引起的病毒病害尤为严重。虽然目前对该病害的基础研究有所进展,市面上也有少数几种药剂能有效地治理该种病害,但其具体的作用机理尚不清楚,导致研发针对该病原体的特效性药剂难度极大。如何有效地筛选抗PVY药物是防治马铃薯病毒病害的关键问题,因此建立一个以PVY关键蛋白为潜在靶标的
目的:岗藿抗感颗粒是在临床治疗流感的经验方“岗藿抗感方”的基础上,加以组方而自制的中药医疗机构制剂,是目前市场上没有供应的品种。前期研究表明岗藿抗感汤能明显改善流