【摘 要】
:
隐私保护数据挖掘技术的目标是在不泄露隐私信息的前提下,使用数据挖掘工具得到准确的挖掘结果,随着人们对隐私问题的日益关注,已成为一个重要的研究方向,目前主要从两个方面
论文部分内容阅读
隐私保护数据挖掘技术的目标是在不泄露隐私信息的前提下,使用数据挖掘工具得到准确的挖掘结果,随着人们对隐私问题的日益关注,已成为一个重要的研究方向,目前主要从两个方面进行研究:数据扰乱技术和安全多方计算技术。研究人员已经提出许多隐私保护关联规则算法、分类算法和聚类算法,但隐私保护离群点检测的算法很少。目前隐私保护离群点检测算法主要是基于距离的算法,通过使用安全多方计算技术中一些通用的安全协议对算法中的隐私信息进行保护,算法复杂度高,数据安全性和可靠性难以满足用户需求;且没有考虑到通信负载的问题,将应用安全协议的集中式离群点检测算法直接应用于分布式数据集,易产生隐私泄露且算法的效率低。本文结合安全多方计算技术、数据扰乱方法和离群点检测算法对以上不足之处进行改进,主要工作如下:(1)构造安全向量和的第k值协议,以该协议和数据扰乱技术为基础,针对数据垂直分割的情况,提出半诚实模型下基于距离的分布式隐私保护离群点检测算法VPPDT~k-Outlier。理论分析与实验均表明:与同类型算法相比较,VPPDT~k-Outlier算法拥有近似线形的通信复杂度,提高了通信效率。(2)分析基于密度的集中式离群点检测算法DBOM的特点,以此算法为基础,结合数据分布方式,提出基于密度的垂直分布式离群点检测算法VDBOM,详细介绍了算法的思想和流程,并从理论和实验两个方面分析和证明了算法能够有效克服DBOM算法应用于分布式数据集时所产生的效率低下问题。(3)构造安全交集协议和安全比较协议,以此协议为基础,提出了半诚实模型下基于密度的分布式隐私保护离群点检测算法PPVDBOM,解决了VDBOM算法所存在的隐私泄露问题,理论证明所提算法能很好地隐藏数据,有效保护信息的安全。
其他文献
随着计算机软硬件、图像处理、机器人等技术的迅速发展,计算机视觉越来越普遍地应用到机器人领域。本文主要针对基于序列图像的机器人的视觉定位技术展开研究,利用计算机视觉
云计算因其特有的大容量存储能力、分布式计算能力、资源共享能力等诸多优点而成为当今及未来的主流计算模式,越来越多的企业和个人选择将数据存入云端,以方便数据的管理和高
随着网络技术的发展,网络终端得到了广泛应用。但在农村、教育等领域,其安全及维护问题成为了阻碍网络终端推广的重要因素。针对网络终端故障维护问题,为了提高网络终端系统
门户系统是近几年兴起的一项web应用,也是web信息系统的新的信息实践和研究领域。它以集成的方式向用户提供广泛丰富的信息资源和多种多样的服务,因此,用户可以“一站式”获
随着计算机和互联网技术的发展,人们对网络的要求不再局限于获得文字形式的信息,越来越多的图像、动画甚至视频等形式的资源充斥着整个网络,“三网融合”促使互联网成为集图
税收收入的预测是国家进行经济决策和编制预算重要参考和依据。长期以来我国税收收入的预测一直采用简单直观的“基数法”。但随着市场经济体系的逐步完善,“基数法”越来越不
在现代社中,安全问题越来越受人们关注,而视频监控成为保障国家、社会、人民群众生命财产安全的最重要的技术手段。它也是目前计算机视觉与模式识别领域里的研究热点之一。视
移动环境是网络发展的必然趋势,该环境下的应用日益普及。空间位置查询是移动环境中一项基本的应用,最近邻居查询是空间位置查询中最重要的一类,其主要目标是使用户更加快速
计算机支持的协同工作CSCW (Computer Supported Cooperative Work)是信息化进程发展的必然产物,提高了人们的工作效率,促进社会生产力的发展,深刻影响着人类群体生产方式、
个性化推荐系统的目的是解决信息过载问题,目前已被广泛应用于互联网的各个领域。传统的推荐系统只通过分析用户-项目之间的二元关系来为用户提供推荐,而忽略了上下文信息对