面向数据挖掘的隐私保护及应用研究

来源 :南京信息工程大学 | 被引量 : 1次 | 上传用户:fengxun1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科学技术的迅猛发展使得人们的生活越来越便利,与此同时,日益剧增的数据量加大了人们获取信息的难度。数据挖掘技术的兴起与发展有利于解决人们信息获取的难题,但是,数据挖掘的大规模应用正在严重危害着人们个人隐私数据的安全。人们享受数据挖掘带来的便利的同时,正在承担着个人隐私泄露的风险。面向数据挖掘的隐私保护技术的研究旨在保护人们隐私数据的同时进行有效的数据挖掘。综上所述,面向数据挖掘的隐私保护技术是一个亟待研究的课题。本文的主要研究工作如下:1.本文提出了一种基于k-means的差分隐私保护方法。此方法首先将原始数据集去除孤立点,其次根据数据集的平均密度确定初始聚类中心,然后按照已经确定的初始聚类中心对数据集进行聚类及匿名处理,最后将噪声数据添加到经过处理的数据集中。由于经过聚类匿名处理后的数据集能够有效减少查询函数的敏感度,从而降低拉普拉斯噪声的添加量,所以基于k-means的差分隐私保护能够很大程度上提高数据的可用性。2.本文在基于泛化的差分隐私匿名算法(Differentially-private anonymization algorithm based on Generalization,DiffGen)的基础上,提出了一种改进的DiffGen算法。传统的DiffGen算法存在着细分方案中隐私预算分配不合理的情况,导致DiffGen算法在实现的过程中隐私预算被过早消耗殆尽。针对这一问题,本文采用方案选择轮盘赌分裂属性,并在细分过程中将原本的平均分配隐私预算改为自适应分配,有利于增加细分次数,提高算法执行效率。此外,本文采用基尼增益作为算法中的可用性函数,有效地提高了指数机制中可用性函数的使用效率。3.本文将面向数据挖掘的隐私保护方法应用到个性化推荐中。个性化推荐也是一种特殊的数据挖掘方法。本文将所提出的面向数据挖掘的隐私保护方法与协同过滤算法相结合,验证了所提出的方法在实际应用中的可行性。这种方法使得人们在享受个性化推荐技术服务的同时,能够保障个人隐私数据的安全。
其他文献
【目的】了解牛病毒性腹泻病毒河北分离株HB株的特性,阐明牛病毒性腹泻/黏膜病致病机理,更好的控制BVDV感染、流行提供理论依据特进行此项试验;【方法】用理化学及生物学方法
针对±1 100 kV直流开关场户内设计方案展开论述,提出了户内直流场设计原则、设计流程及方法,对户内直流场设计的主要电气参数进行计算,并给出计算结果。结合1 100 kV设备特
目的分析小儿肺炎支原体感染临床检验的诊断价值。方法 2013年8月~2016年11月于某院收治的小儿肺炎支原体感染患儿中选取50例,所有患儿均得到临床确诊,采用快速血清学检验方
乔伊斯的短篇小说《阿拉比》脱离传统叙事轨迹,体现了抒情式短篇小说的特点。它轻情节,以情绪气氛的起伏为主线;采用多种言语修辞手法,营造丰富意象;开放式的结尾,引发读者的
食品健康是现代社会关注重点内容,为保证食品食用安全性,相关部门纷纷加大了对食品检验工作的研究力度,并将微生物检验技术运用到了食品检验之中。本文将以食品检验重要性分
在力学中有很多的研究对象是通过“轻绳”和“轻杆”连接的,在实际解题过程中,发现不少同学对这两种模型特点、区别还不够清楚,容易混淆,造成解题错误.下面就这两种模型的特点和不
目的:研究骨肿瘤保肢治疗中高温水浴灭活骨重建骨缺损可能的成骨机制。 材料与方法:选取新西兰大白兔32只,随机按观察时间分为4、8、12、24周分为4组,8只/组。取双侧胫骨
低碳经济实质上是经济发展方式、能源消费方式、人类生活方式的一次新变革,它将全方位地改造建立在化石燃料基础上的现代工业文明,转向生态经济和生态文明。本文就连云港发展
以黑荆树叶片为外植体,在MS培养基中添加不同质量浓度的细胞分裂素6-苄氨基嘌呤(6-BA)和细胞生长素2,4-二氯苯氧乙酸(2,4-D),诱导培养出愈伤组织,采用香草醛-硫酸法和Folin-Cioca
本文主要考察中原官话两代间一级元音的变化情况。一种语言或方言的现状包含了历史演化的遗留和未来趋势的征兆。语音的共时年龄差异有可能提供历时演变的轨迹,而不同年龄说话人的表现则会提供具体的例证。由于大城市中由年龄造成的语言差异大于乡村,因此,本文采用的语料来源于中国语言资源保护工程(PPLRC)调查所得的河南省七个地级市的两代录音。这七个地级市包括开封,商丘,许昌,漯河,周口,南阳及驻马店。本文根据“