论文部分内容阅读
隐私保护是数据挖掘背景下非常重要的研究领域。这是在无限信息世界获得最佳隐私保护目的的知识收集的第一步。这个研究项目的阐述数据库知识发现,隐私保护数据挖掘的基础,K-匿名模型的隐私保护数据的共享和安全多方计算模型的数据共享。此外,本文还介绍了一些有用的数据挖掘算法,这些算法与隐私保护、隐私保护技术分类和隐私保护数据挖掘技术及应用紧密结合。隐私保护数据共享技术的混合方法为在隐私保护的数据挖掘环境下触摸混合方法论的细节打开了大门。基于文献的讨论,关于数据消毒和所做的K-anonimyzaton实验主要是是为了证明在论文后半部分所作报告提及的假设。这篇论文焦点主要集中在数据挖掘中的隐私问题,尤其是在数据挖掘前的数据共享。尤其,某些情况下认为隐私保护数据挖掘技术和混合技术在其中的应用需要隐私保障。在这样的情况下,致力于隐私保护是多方面的。一个人不仅要满足私有性的要求,而且还要保证有效的数据挖掘结果。这种困境表示迫切需要反思机制,以加强私隐保障在不失数据挖掘的好处情况下。所介绍的机制可导致新的隐私控制方法将一个数据库转换成一个新的,在这样一种方式下去保留原来的数据库挖掘的主要特点。隐私保护数据挖掘已成为越来越受欢迎和不断发展的研究领域,它允许以分析为目的的隐私敏感数据的共享。今天,组织变得越来越不愿意分享他们的统计数据,而频繁导致个人不是拒绝分享他们的数据就是提供不准确的统计数据。近几年,出于在互联网上的敏感信息的广泛扩展的原因,隐私保护数据挖掘已被广泛地研究。知识是很重要的,然而在勘验知识的同时隐私必须得到保护。特别是,将一个被分享的数据库转化成一个新的数据库的问题被处理,隐瞒私人信息同时保持原始数据库中的一般模式和趋势。这一具有挑战性的问题的解决方法是提出隐私保护数据挖掘的混合模式和框架,以确保在一定的安全程度上挖掘过程不会侵犯隐私。该框架涵盖了家庭隐私保护的数据转换方法,算法库,保护转化过程中隐私的加速检索机制,和一组评估所提出的算法的有效性指标,根据信息丢失和量化到多少私人信息已被披露。隐私保护的好处就是来源广泛的隐私保护数据分享,例如医疗记录,刑事司法调查和诉讼程序,金融机构和交易,生物性状,如遗传物质,生存和地理记录,种族,隐私违反,基于位置的服务和位置。在这项研究中,我们将说明为什么数据挖掘本身并没有威胁到隐私,我们会调查两种方法,使它没有透露敏感的数据,K-匿名模型和安全多方计算。最终的混合模型是通过使用混合算法实际使用中对一些矩阵的成功证明,使用一些数据的消毒方法进行测试。这篇论文的主要贡献如下(1)对于隐私保护数据共享的先进诱导K-匿名模型,算法和安全多方计算:模型的发展。对各种K-匿名方法进行了研究,并且对存在的问题进行了分析,使k-匿名信息的损失降到最低,并证明所提出的模型是更先进的在信息和可靠丢失这两方面。然后,采用逼近算法来获取一个相对于熵测度的近似比。最终一个产生K-匿名决策树的算法被提出,该算法比现有的算法快35%。安全多方计算模型已经被发展来举例说明同态加密作为SMC基于隐私保护的数据挖掘技术的基本思想。(2)制定在隐私保护的数据共享下的数据挖掘环境的混合模型和框架的工作。一系列的隐私保护数据共享(PPDS)方法被研究,用于在数据挖掘和集群共享数据之前保护个人隐私。在这种方法中最重要的里程碑是带有一个更有效和灵活模型的混合框架结构的发展。这里介绍的模型具有独特的进步,如当与其他可用模型比较时有效性和可靠性是非常高的。(3)隐私保护数据共享的混合算法发展。为了加强在数据挖据中的知识保护,算法库被提出。这样算法的设计考虑到我们HMPPDS的方法的启发式。混合算法被发展通过合并消毒算法最佳功能和适合所述框架的K-匿名决策树,在此背景下该算法优于现有算法。我们的研究结论认为,隐私保护数据挖掘在一定程度上是可行的。这篇论文从经验上和理论上证明了在数据挖掘中获得隐私保护的实用性和可行性。我们的实验表明,该框架是有效的,满足隐私需求,保证了有效的数据挖掘结果在保护敏感信息的同时。