保护隐私的分布式数据挖掘研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:kekezhu99
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘,作为一种能够帮助人们从大量数据中提取或“挖掘”有用信息的强有力的技术,已经被应用到众多的领域,如金融、电信、零售业、科技,甚至国家安全领域等。然而,在得益于数据挖掘技术提供的服务的同时,用户的隐私和数据安全正在受到威胁。特别是,随着经济全球化的发展,数据越来越多地分布存储在多个地方,而且数据挖掘任务也越来越需要有着竞争关系的多个参与方之间通过合作去完成。当然,在这合作的过程中,任何参与挖掘任务的一方都不想泄露自己的隐私或敏感信息。因此,在分布式合作环境下保护隐私的数据挖掘的实现就显得尤为重要。   1982年由姚期智提出的安全多方计算技术能够保证参与合作计算的各个参与方在不泄露各自隐私的情况下,获得正确的计算结果,而这一点恰恰满足了分布式数据挖掘中隐私保护的要求,所以本文将结合安全多方计算的技术来探讨保护隐私的数据挖掘的实现,主要的研究成果包括:   1.在聚类分析应用方面,细致分析了一种基于密度分布函数的DENCLUE聚类算法中涉及隐私保护的各个部分的安全性计算,在这基础上给出了数据在水平划分下和垂直划分下的保护隐私的DENCLUE协议的实现,其中针对垂直划分下两方和多方的不同情形给予了不同的实现。   2.在离群点检测应用方面,讨论了两种不同类别的离群点检测算法的隐私保护的实现。一种是基于偏差的离群点检测,介绍了能在线性时间内完成的顺序异常检测技术,并给出了其在数据水平划分下隐私保护的实现;另一种是基于距离的离群点检测,实现了其在数据垂直划分下两方和多方情况下的隐私保护。   3.在数据挖掘预处理应用方面,探讨了保护隐私的基于粗糙集的属性约简问题的求解,给出了其在数据水平划分下和垂直划分下的解决方案。   本文对实现的各种保护隐私的数据挖掘协议的安全性、时间复杂度和通讯复杂度都给予了详细的分析。
其他文献
随着信息技术和网络技术的发展,很多企业都有自己的局域网,各种对应的网络设备层出不穷。这些设备虽然可以调节自己的时钟,但是无法保证所有的设备和主机的时间是同步的。本文所
已有的电子支付系统大多采用联机在线支付方式,不支持电子现金找零,给实际应用带来很多困难。金融国际化和经济全球化要求克服国内已有电子支付网络平台难以普及的弱点,开发一种
数字信号处理(Digital Signal Processing,DSP)普遍采取静态指令调度技术的VLIW(Very Long Instruction Word)体系结构,在很大程度上依赖编译器的处理。这对编译器的设计和应用
无缝拼接系统是对多媒体进行大范围、高分辨率显示的一种有效实现方式。它所带来的超大画面、多屏显示以及清晰逼真的显示效果使得监控、安防、会议、模拟仿真等领域的工作效
随着汽车行业的快速发展,汽车控制网络(简称车控网)开发周期的缩短和开发成本的降低,对于汽车开发来说,变得越来越重要。为车控网的开发引入低成本的软硬件协同设计开发工具链,特
硬件发展模式从以前的提高CPU主频速度转变为现在的增加CPU内核数量,注定了软件开发技术的变革。软件的性能再也不可能因为硬件的简单升级而带来显著提高。想要发挥多核的威
基于无线传感器网络(WSN)的目标监测是无线传感器网络最广泛和最重要的应用之一,也是当前研究热点之一。由于具有自适应性、灵活性和低能耗性等特点,基于无线传感器网络的目
随着互联网技术的高速发展,网络上的文本种类越来越多并且日益高速增长,人工筛选适合的文本种类是不切实际的,对互联网上的各类文本进行信息采集就不可避免的使用到智能化的
随着网络信息技术的不断发展,全球使用互联网的人数在持续的增加,互联网已经在很多行业进行实践和应用,带来了互联网数据的批量式增加,分析处理这些海量的互联网数据是一个至关重
随着我国市场经济的发展,以及加入WTO后市场竞争的加剧,商品销售企业面临前所未有的挑战。在客户市场趋子饱和的前提下,如何保持和完善客户关系、提升客户价值成为企业关注的焦