面向分布式环境的隐私信息保护技术研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:by_huang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘可以从海量的数据中提取隐藏的、有用的数据,为商业、医学研究等做出了重要贡献。近年来数据挖掘技术发展迅速,应用广泛,大量如消费记录、病历记录等私有信息被收集和分析。如何在保护隐私的前提下进行数据挖掘成为数据挖掘领域的一个很有意义的研究热点。  随着网络、数字存储技术的迅速发展,数据呈现出海量化和分布式存储等特点,分布式数据挖掘变得越来越普遍。关联规则挖掘是数据挖掘应用最广泛的方法之一,本文针对分布式环境,以保护隐私数据的同时提高算法的准确性和高效性为目的,对关联规则挖掘算法展开了研究。  本文的主要工作包括:  (1)介绍了分布式环境下隐私保护的关联规则挖掘算法的国内外研究现状及数据挖掘、关联规则挖掘领域的基本理论,分析了当前经典的分布式关联规则算法,归纳总结了数据挖掘中的隐私保护技术。  (2)针对水平分布式环境,提出一种改进的隐私保护的关联规则挖掘算法。该算法使用部分隐藏的随机化干扰方法对各站点持有的数据进行隐藏与扰乱,采用项集位运算计算项集局部支持数,结合部分隐藏的随机化回答方法和同态加密机制,计算全局支持数。  (3)针对垂直分布式环境,设计了一个利用加法同态加密算法安全多方计算项集全局支持度协议SMISGSP,该协议使用部分隐藏的随机化回答方法对各站点持有的数据进行隐藏与扰乱,利用Paillier算法的加法同态特性计算扰乱后的项集全局支持数,并重构项集原始支持数。最后,结合DMA算法,提出了一种改进的垂直分布式的隐私保护的关联规则挖掘算法EP-VDMA。  (4)对本文设计的两个算法进行了实验,实验结果表明这些算法具有较好的准确性、高效性和隐私保护性。  论文的创新性包括:  (1)提出了一种改进的数据水平分布的隐私保护的关联规则挖掘算法,该算法提高了项集局部支持度的计算效率和项集全局支持度计算的安全性。  (2)提出了一种基于安全多方计算项集全局支持度协议SMISGSP的改进的数据垂直分布的隐私保护关联规则挖掘算法,该算法提高了项集全局支持度的计算效率及其安全性。
其他文献
新一代红光高清视盘机(Next-Generation Versatile Disc,NVD)在网络化背景下推出网络认证系统(Internet Certification System,ICS),ICS编著软件是该系统的关键环节,提供制作节目光盘
在云计算环境中,通常提供虚拟机监控功能获取虚拟机的运行状态和资源使用情况。然而,现有的虚拟机监控机制着重于对虚拟机进行粗粒度监控或仅针对特定类型的虚拟机进行监控,难以
流形学习和稀疏表示是计算机视觉、模式识别与图像处理领域中的研究热点,近年来受研究者的广泛关注。其中,流形学习的基本假设是图像在高维空间的特征表现往往蕴含着低维流形结
本文旨在解决含有资源组合、约束冲突的任务组合指派问题,使协同工作分工明确具体,各部门高效有序完成协同工作。任务的组合与指派是协同工作需要处理的关键问题,合理的组合和指
编译器是软件开发的基础支撑工具。它的正确性直接影响着应用软件的质量。因此编译器的质量是至关重要的。正如其他软件一样,软件测试对于编译器的开发来说是质量保证和错误检
发布/订阅机制或模型及其衍生模型因具有可扩展性强和松散耦合等特性已被广泛用于大规模分布式应用和系统当中,并受到越来越多的研究机构和商业公司的关注。与此同时,在使用了
虚拟化技术隔离硬件体系结构与软件系统的紧密依赖关系,使得多种操作系统和应用程序上运行的工作负载合并到单一物理平台上,为物理资源的共享提供了可靠的解决方案。由于各种不
目前,网络视频网站的主要盈利模式为首页广告、播放缓冲广告和播放器界面广告等方式。这类盈利模式相对来说比较单一,而且会影响网站的用户体验和发展前景。在视频网站的海量视
作为虚拟化的个重要特性,检查点可以对虚拟机进行系统级的状态保存,并确保完成后虚拟机可以继续运行,目前已经广泛应用于集群和数据中心的系统维护、容错灾备及测试调试上。尽管
近年来,因特网已经成为有史以来存在的最大的信息源,电子零售商提供了大量的产品可供人们选择。在这种情况下,人们常面临着大量选择,例如阅读什么样的在线新闻,看什么样的电