隐私保护分类数据挖掘研究

来源 :内蒙古科技大学 | 被引量 : 0次 | 上传用户:xiaozhao550
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,随着数据库技术和网络技术的发展,许多领域都积累了大量的数据。巨增的数据背后蕴藏着丰富的知识,如何从这些数据中提取出对决策有价值的知识,成为人们关注的焦点。数据挖掘作为一个强有力的数据分析工具,可以发现数据中潜在的模式和规律,在许多领域做出了巨大的贡献,具有广泛的应用前景。数据挖掘技术带来巨大利益的同时,由于被挖掘的资料或数据包含着许多个人的隐私信息,例如:病人的病情信息、顾客的喜好、个人背景资料等,这些信息一旦被泄露会给个人带来很大危害。如果把这些数据库的真实数据直接交给挖掘者,难免会产生隐私信息泄露。随着数据挖掘技术应用领域不断深入,隐私泄露问题越来越严重,引起业界和社会各方面的广泛关注。因此,如何在隐私保护条件下进行数据挖掘成了数据挖掘领域的研究热点之一,隐私保护数据挖掘(PPDM)也随之产生。分类数据挖掘是数据挖掘的主要类型,决策树是分类挖掘最常用的分类器,所以采用决策树分类的隐私保护分类数据挖掘方法已经成为近年来数据挖掘领域的研究热点。目前,隐私保护分类数据挖掘采用修改数据的方法很多,随机扰动技术是比较常用的一种,它可以不改变原数据本质特征。但现有的隐私保护分类数据挖掘方法有很多缺陷,如:适用的数据类型有限、随机扰动后会产生隐私破坏、重建原数据分布的错误率较高、隐私保护度低或挖掘精度低等。针对这些缺陷,提出一种隐私保护分类数据挖掘的方法,该方法利用随机扰动矩阵对数据进行转变,通过由单属性随机扰动矩阵生成的多属性联合随机扰动矩阵和转变后的数据集来重建原数据分布。为使其适应于多种数据类型,对原始数据集的每个属性的不同值编码;给每个属性都选择一个随机扰动矩阵,增加了隐私保护度,而且在选择随机扰动矩阵时,引入r-amplifying方法防止数据转换后隐私破坏;引入矩阵条件数,降低了重建原数据分布的错误率,提高了挖掘的精度。
其他文献
随着互联网的高速发展,通用爬虫在浩瀚如海的网络世界里,对高效提取有效网页信息显得越来越力不从心。而主题爬虫是解决通用搜索引擎可扩展性限制的有效方法。它可以指导抓取
网格计算是近年来的研究热点之一。它可将高速互联网、电脑、大型资料库、传感器、远端设备等融为一体,实现它们的全面共享与协同工作。网格任务调度是网格计算研究的核心内
微小型四轴无人机因其机动灵活、机械结构简单、性价比较高等特点,逐渐成为无人机领域中的研究热点。在对微小型四轴无人机进行设计时,一个稳定的嵌入式飞行控制系统是实现其
随着现代社会的快速发展,异步电机被广泛的应用于生产生活的各个领域。如低端的工农业生产,高端的军事设备及航空航天仪器方面。因此确保电机安全和稳定的运行变得越来越重要。
近年来随着互联网的飞速发展,网络中的信息量急剧增加,用户如何能够在最短时间内获得最需要的信息成为目前信息检索领域的首要问题。现有的搜索引擎都在一定程度上存在搜索覆
本论文围绕Internet下遥操作机器人系统的网络优化进行研究,主要研究内容为网络数据传输。首先,针对网络回路往返时延(RTT)的自相似性,提出基于自适应滤波的RTT预测算法;其次,
本论文首先围绕移动P2P网络的特点、信任管理在安全中的作用、信任管理问题的研究现状等问题进行了论述。通过借鉴国际上有关移动P2P网络技术的先进经验,为移动P2P网络设计了
学位
近年来,信息技术高速发展,数据采集和存储技术不断进步,国防科技化、现代化步伐不断加快,并且随着“智慧军工”概念的提出,对于军工领域信息化建设的要求也越来越高。各国对
随着全球信息化的迅速发展,信息已成为社会发展的重要资源,围绕这一资源所开展的全球性的竞争日趋激烈。“电脑有价,数据无价”是信息时代对数据重要性的认可,信息社会的发展