基于扰动技术的隐私保护数据挖掘研究

来源 :四川师范大学 | 被引量 : 5次 | 上传用户:shashh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,随着数据库技术和网络技术的发展,计算机数据存储功能不断进步,数据挖掘作为一个强有力的数据分析工具,在许多领域做出了巨大的贡献,具有广阔的应用前景。不断出现的各种数据挖掘算法指出,越来越多的信息可以从社会组织中直接获得,因此个人、企业或者事业单位之间的隐私安全保护问题显得日益重要。目前,在数据挖掘中,隐私保护最常见的是数据扰动方法。相对于传统的方法,基于统计学、数据分区以及关联规则下的扰动是一种十分高效的方法,可以较好的保护个人数据的隐私。本文针对数据挖掘中的隐私保护问题,基于数据扰动的思想方法,分别在决策树、分区环境和关联规则等三个方面进行了分析和研究,对保障用户的隐私保护需求给出了合理的解决方案。本论文的主要研究内容包括:(1)在扰动方法基础上提出隐私保护挖掘的层级分类,对目前隐私保护数据挖掘的各项技术进行系统分类,总结了基于扰动方法下的隐私保护算法的基本思想和原理,并对这些隐私保护方法从实用性、难易程度等方面进行分析评估。(2)在决策树方法研究的基础上,利用决策树结构特点与扰动算法的两种基本方法相结合,提出了针对决策树结构属性的扰动方法和决策树降级方法。在此基础上给出两个实例论证我们的方法的有效性。(3)通过对原始数据库进行分区的方法,结合扰动思想对原始数据进行隐私保护,研究了以kd扰动树为基础的对于分区扰动方法,并对这种方法进行分析和风险评估。(4)以关联规则理论为基础研究了数据挖掘中对信息的规则隐私保护方法,并通过基于关联规则的两个扰动算法展开讨论,初步研究了关联规则扰动方法在保护隐私方面的应用问题。
其他文献
本文首先提出了当前我国消防应急疏散照明设计中存在的问题;简要介绍了智能疏散照明的技术特点及其在智能建筑中的应用优势;结合实际工程,着重讨论了智能应急疏散照明系统在
在捷联惯导系统中,加速度计和陀螺的输出数据中不可避免的会有噪声干扰,影响到输出值的精确度,进而影响到解算值的精确度,使得导航姿态解算精度不高。神经网络算法具有很好的对陌
本文主要研究了4-进复小波的构造方法.复数小波在应用中有一些实数小波所不能替代的优势,然而复数小波的研究相对较少.尤其是多进复小波由于构造较为复杂,可供应用选取的实例不
自改革开放以来,我国的保险业一直处于高速发展状态,作为社会保障及金融体系的重要组成部分,有着不可替代的作用。但是与发达国家保险市场相比,我国的保险业还存在着许多不完善的地方,而且我国的保险业在地域发展上也存在着巨大的差距。保险数据分析是统计学的一个重要应用领域,从前期的保费核定工作开始,再经过一系列风险评估、赔付率计算,到后期的保费收入、报案量、结案量预测,统计理论贯穿始终。随着保险业规模的不断扩
基于金属纳米结构而获得随机激光的增强,其独特的性质及其潜在的应用价值具有重要的研究意义,在表面增强荧光、光学开关器件、表面等离子激元激光等方面实现了较多应用。本研究提供了一种快捷有效地制备纳米颗粒的方法并基于该纳米颗粒结构分析了染料掺杂聚合物薄膜涂覆的随机激光现象和规律。本论文围绕Au纳米颗粒的制备和应用展开研究,利用金属溅射沉积和高温热处理技术获得不同粒径分布和光谱特征的Au纳米颗粒;通过涂覆有
学位