隐私保护序贯模式挖掘研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:jxwdi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分布式或网格环境中隐私保护数据挖掘是近年来的一个热点研究问题。分布式环境中,与传统的集中式数据挖掘不同,隐私保护的数据挖掘需要解决如下矛盾:一方面,各数据持有方都希望保持自己的私有数据不为其他任何一方所知;另一方面,它们又希望通过合作获得全局数据模型。因此,需要研究新的算法使得各方在不共享原始数据的情况下进行正确的数据挖掘,称为隐私保护数据挖掘(Privacy-Preserving Data Mining,简称PPDM)。 本文首先结合数据分布方式、数据修改方式、数据挖掘算法、数据或规则保护和隐私保护技术五个角度,分析了当前流行的隐私保护数据挖掘方法。 然后文章针对数据挖掘中应用较为广泛的序贯模式挖掘问题,提出隐私保护序贯模式挖掘算法,不同的数据分布方式,需要不同的解决方法。主要工作包括: (1)针对数据水平分布的情况,提出了水平分布数据的隐私保护序贯模式挖掘算法。其中包括全局候选频繁项收集协议以及候选项支持度收集协议。全局候选频繁项收集协议主要采用了可交换加密方式来最小化信息共享,保护单个站点的局部频繁候选项集信息,同时在数据挖掘和处理上增加的系统开销非常小;候选项支持度收集协议主要采用了安全和技术,来保护单个站点上候选项集的支持度信息。从理论分析上了协议的隐私保护性,通过实验证明协议是高效可行的。 (2)针对数据垂直分布的情况,提出了垂直分布数据的隐私保护序贯模式挖掘算法。其中包括安全两方交易时间比较协议以及安全两方点积协议。安全两方交易时间比较协议主要采用了同态加密技术,在不泄露数据具体值的情况下,完成项集发生时间先后的比较;安全两方点积协议同样采用了同态加密技术,在不泄露各自具体向量值的情况下,完成点积计算。从理论上分析了所提出协议的正确性和隐私保护性,直接运行点积协议花费的时间比较多,接着提出了几种优化技术来改进协议的性能,通过实验分析了改进后的点积协议是高效可行的。
其他文献
支持向量机是一种新型的模式识别技术。由于具有完备的理论基础和良好的性能,支持向量机已经成为模式识别的一个研究热点。在实际应用中,现有的支持向量机模型存在一些缺陷,
近年来,WEB系统遭受着日益频繁的网络安全攻击。在众多的网络安全攻击中,SQL注入攻击具有相当大的威胁性,攻击者通过提交精心构造的数据库查询代码欺骗服务器执行恶意的SQL命令,
色彩管理技术有着广阔的应用前景,近几年得到迅猛发展。而分光测色仪则是色彩管理中不可或缺的高精度颜色测量设备。目前,动态分光测色仪技术还主要掌握在美、德等国家。以实际
网络安全防护现在已经向纵深发展,企业内部署实施了各种各样的安全产品和安全技术,包括防火墙、访问控制列表、网络地址转换、入侵检测、虚拟专用网等。传统的分散式网络安全管
支持向量机(SVM)是一种基于结构风险最小化原则的通用模式分类方法,由于其强大的学习能力和良好的泛化性能,支持向量机已经应用到许多模式分类领域。最优分类超平面原理使SVM在
互联网数据已达海量规模,用户的信息查询要求不断提高,传统搜索引擎在大数据环境下的工作效率已不足以满足人们的信息需求,而元搜索引擎具有较高的信息覆盖率、且推荐服务可以将
智能交通系统(ITS)是通过对场馆、道路进行监控,运用先进的信息、通信、控制等高新技术对传统交通运输系统进行改造而形成的一种信息化、智能化、社会化的新型交通运输系统。
手机作为一种通讯工具从问世到现在,随着技术上的壁垒不断被突破,手机的功能越来越强大。各个手机制造商、服务商的研发、运作经验日益成熟、完备。手机已经成为人们日常生活
本课题主要进行高速大幅面彩色喷墨绘图机数据传输系统的嵌入式移植及系统驱动程序设计与实现。本文将从硬件系统设计和软件程序设计两大方面来阐述。 硬件系统设计主要完
在关系数据库中,无环数据库模式设计是数据库理论与图论相结合而产生的一个新的研究领域。无环数据库有许多优良特性,无环成为判断数据库模式优劣的又一重要标准。这里的环指