基于差分隐私保护的数据聚类方法研究

来源 :华北电力大学(北京) | 被引量 : 0次 | 上传用户:Kfreshman
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,数据挖掘被应用于许多领域。但是,数据挖掘所使用的数据中通常包含用户的一些个人信息,恶意的分析人员可能利用数据挖掘技术获取某些隐私信息,从而造成个人隐私泄露,对社会和个人都造成不良的影响。差分隐私技术作为一种具有严格定义的隐私保护技术,受到了广泛的关注。聚类分析作为数据挖掘中一个重要的研究方向,在其分析过程中,也存在着隐私泄露的问题。如何在满足隐私保护的前提下,提高聚类结果的可用性,实现隐私性和可用性之间的平衡,是一个具有应用价值的研究课题。本篇论文从实现满足差分隐私保护的聚类算法以及提高其可用性的角度出发,对聚类算法中存在的隐私泄露问题进行分析,针对满足隐私保护的聚类算法中隐私预算的分配、初始质心的选取和簇的个数无法确定等问题提出了三种差分隐私保护的数据聚类算法。(1)为了提高满足隐私保护的K-means聚类算法的效率和可用性,在MapReduce分布式框架下提出了一种高效的满足差分隐私保护的数据聚类算法EDCDP。基于canopy算法设计了一种可以部署于MapReduce框架的聚类初始质心选取方法,并通过优化隐私预算的分配方案提高聚类结果的可用性。(2)为了解决混合型数据集聚类算法的隐私保护问题,基于K-means算法和K-modes算法,提出了满足差分隐私保护的混合型数据聚类算法ODPC。通过分析引入差分隐私带来的损失,改进隐私预算的分配方案,提高了聚类结果的可用性。(3)为了解决簇的个数不确定的数据集聚类算法的隐私保护问题,基于非参数贝叶斯方法提出了一种满足差分隐私保护的聚类算法IDPC。IDPC无需提前确定簇的个数,且簇个数会随着数据集自适应地变化。此外,设计了一种合理的机制以确保算法满足差分隐私保护。针对以上算法,我们提供了详细的安全性分析和性能分析,证明所提出的算法能够在满足隐私保护的前提下,提高了算法结果可用性,实现隐私性和可用性之间的平衡。
其他文献
随着我国人口老龄化问题的日益加剧、城镇生活水平的明显提升、财富水平的增长以及医保制度的推行,我国对医疗服务的需求正在不断提升。对医疗服务需求的飞速增长与紧缺的医
随着信息技术的快速发展,人们对信息量的需求愈发强烈,传统的信号处理技术已经无法满足现实的需求。压缩感知(CS)理论的提出突破了奈奎斯特采样定理的压缩极限限制,并且催生
2016年,国务院总理李克强在讲话中首次提出,各级党政机关需要持续推进简政放权、放管结合、优化服务,不断提高政府效能,并首次提出了“放管服”的改革要求。北京大学第一医院作为北京大学下属二级事业单位,单位性质属于中央差额预算事业单位,其资金来源均为财政资金,所以该单位的工程类政府采购应通过中央国家机关政府采购中心进行。在“放管服”改革要求下,国采中心提高了采购限额标准,给予了采购人更加充分的自主选择
机器人视觉伺服控制系统是一种利用视觉信息对机器人运动实施实时反馈控制的重要方法,与传统的示教再现的方法相比,视觉伺服依赖外部视觉传感器,能够实现对目标物体的动态追
尽管我国近年来在水体环境污染控制方面取得显著成效,但该过程涉及诸多复杂因素,彻底解决水环境问题仍需要一个长期过程。目前,巢湖等一些主要水体蓝藻爆发依然频繁。在蓝藻爆发时,通过物理、化学等方法快速清除蓝藻,是避免蓝藻腐败后水体发黑发臭的重要手段之一。然而,快速除藻过程的藻毒素溶出等二次污染问题仍未得到充分重视和有效解决,特别是,对于除藻过程溶出藻毒素的原位去除技术与装备的研究较为空白。针对这一问题,
跨膜蛋白是一种镶嵌在生物膜上的蛋白。跨膜蛋白在细胞生理功能中扮演着至关重要的角色,不过其在细胞中的表达量通常并不高。细胞外信号的感受器如EGFR,TGFβR等都是跨膜蛋白
废胶粉改性沥青具有高温稳定性优良,低噪声等优点。同时,废胶粉是通过回收废旧轮胎得到的,具有价格低廉,环境友好等优势。因此废胶粉改性沥青具有良好的应用前景。但是由于废胶粉和沥青之间相容性不足,容易产生离析,导致改性沥青的稳定性较差。另外废胶粉改性沥青的黏度较大,制备和摊铺过程需要更高的温度,这对改性沥青混合料的路用性能不利。本文针对废胶粉改性沥青黏度较大、储存稳定性差和低温性能不足等缺陷,开展废旧胶
当今,随着云计算技术的广泛应用,从政府部门到大型企业,重要业务都已向云端迁移,云计算已经成为保障国计民生的重要技术。凭借敏捷、高效、灵活的特点,Docker容器技术成为云计算领域的热点技术。然而,随着容器技术的流行,容器安全问题高发,安全防护形势日趋恶化的局面成为社会关注的重点。面对严峻的网络空间安全现状,《网络安全法》的颁布实施有力扭转了这一局面,作为网络空间安全管理方面问题的基础性法律,该法规
“经济人”假设是新古典经济学中核心的理论假设,这一人性主张被直接或间接地应用在世界各国对公务员的管理当中。但近年来从行为经济学在经济观察和实验研究基础上发现大量个体在其行为活动中并非单纯地考虑自身利益,在一定条件下也会顾及他人、集体或公共的利益,这种亲社会的倾向被称为“社会偏好”。社会偏好在公务员行为管理中存在一定的价值,能够为政府部门绩效带来积极影响。本文运用文献分析、统计分析等方法对公务员行为
目的探讨NF-κB通路在调节口腔鳞癌(oral squamous cell carcinoma,OSCC)迁移和侵袭中的作用及其对上皮膜蛋白1(epithelial membrane protein 1,EMP1)表达的调控。方法首先,在SCC-15细胞中研究LPS对NF-κB通路的激活机制。采用WB技术、q RT-PCR技术和细胞免疫荧光技术,检测IκBα蛋白、p65磷酸化蛋白和促炎因子IL-6