一种基于个人化匿名的多敏感属性隐私保护算法

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:godman007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于传统的敏感数据方法主要针对单一敏感属性的数据,然而很多现实应用中,发布的数据往往涉及到多个敏感属性。目前多敏感属性的数据发布方法成为重要的研究方向,但由于不同人对隐私保护的要求程度不同,在统一匿名概括过程中传统的匿名算法导致数据的过分保护和保护不足。因此,研究基于个人化匿名和多敏感属性的隐私保护算法,是数据库安全未来研究的一个新的发展方向,对隐私保护技术提出了新的挑战。   论文首先分析数据库隐私保护现有的主要技术,研究现有多维敏感属性数据发布时隐私保护技术的主要特点,针对由单维敏感属性表都满足匿名条件合并多维敏感属性表产生大量冗余信息的问题,论文提出一种多维敏感属性的隐私保护方法,采用基于最小信息损失的概括策略来改进匿名模型,然后将概括问题转化为带特定约束的聚类问题,改进传统笛卡尔积算法应用在合并多维敏感属性表时造成的信息损失。其次由于多维敏感属性数据发布技术在匿名化过程中没有考虑单一个体对应多条记录的情况,导致了同一个人多个敏感属性之间关联信息丢失的问题,本文提出一种基于身份保持的多维敏感属性匿名算法,采用有损连接方法并结合(K,L)-匿名模型的数据发布技术,避免单一个体对应多个记录情况在匿名中的过度泛化问题。最后论文在基于个人匿名要求的多敏感属性数据发布这一应用场景下,通过对个人匿名相关隐私技术发展趋势的分析和研究后,综合考虑数据安全性和信息有效性两个特点,采用更为灵活的执行策略即多敏感属性语义分类树的动态控制技术,提出一种能够解决关系数据库中多维敏感属性发布数据时隐私信息泄漏的模型,并给出相应的算法。   本文利用仿真实验结合Matlab进行数据处理,详细叙述所提出的多维敏感属性方法在信息冗余度和有损连接及个人匿名化要求的处理结果。通过曲线图对实验数据及其处理结果进行综合的分析与比较,说明本文提出的方法在克服冗余信息缺点同时能够更好地保护隐私数据集的准确性。通过仿真实验结果验证本文提出的方法可以满足每个人隐私要求的最小量概括,最大程度地保留了原始数据中信息,从而达到提高挖掘结果准确性的效果。
其他文献
随着以Internet软件为核心的信息系统的深入,基于Internet的分布式计算机系统及开放式网络环境增加了系统的复杂度、故障率和不安全因素,使得软件系统变得日趋庞大和难以驾驭
随着我国的经济发展,城市规划建设工作也就显得尤为重要,给水管网也随之成为城市居民的生活命脉,为了实现有效的对供水管网的管理,本文探索了基于.NET与ArcGIS Server结合技
近年来,无线传感器网络引起了世界各国军事部门、工业界和学术界的极大关注。数据聚集是传感器网络中一个比较耗时的操作,特别是在高密度网络中。例如,在一个森林火灾监控系
计算机技术与互联网技术迅速结合形成了独特网络文化,流传于网络的大量数字信息给人们的日常生活和工作带来巨大影响。一方面,诸如图书封面、信封封面、文档内容的文字部分等
无线射频识别(radio frequency identification,RFID)技术是从上世纪八十年代兴起的一项非接触式自动识别技术。RFID技术目前已经得到广泛的应用,但其安全机制还不够完善。  
针对无线Ad hoc网络中存在的TCP协议性能下降问题,研究者提出了包括端到端的改进方案,单层改进方案,跨层改进方案等各种方案,但这些方案均具有各自的缺陷,特别是不能有效解决
随着互联网技术的高速发展和计算机的大范围普及使用,人们的日常生活越来越离不开信息技术的支持。智能教学系统在信息检索、数据挖掘、机器学习等前沿计算机技术的支撑下有
复述是含义相同而表达方式不同的词、短语和句子。例如,英文单词“film”和“movie”为单词级别复述又称同义词或近义词;英文短语“take care of”和“look after”为复述短
恶意程序是威胁计算机与网络系统安全的一个重要因素,已成为计算机犯罪的一种新的演化形式。随着计算机和互联网技术的迅猛发展,恶意程序的传播速度、传播范围以及破坏程度日益
企业服务总线(Enterprise Service Bus, ESB)作为面向服务体系架构SOA(Service Oriented Architecture)的核心框架,是企业异构应用交互的基础平台,具有高效、全面、灵活的特