基于子图泛化的社会网络隐私保护

来源 :电子科技大学 | 被引量 : 5次 | 上传用户:jxnydxlhy1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展,大量社交网站日益兴起。越来越多的信息暴露于网络当中,如果这些数据落到不恰当的人手中,轻则给人们的生活造成困扰,重则造成重大经济利益损失。因此,人们越来越关注自己的隐私是否被有效地保护起来,针对社会网络隐私保护的研究开始成为热点。传统的隐私保护技术一般针对关系型或者表格型数据,其思想已经比较成熟,很多隐私保护方法都得到了成功的应用。例如泛化技术、匿名化技术、随机扰动技术等等。匿名化技术实现起来比较复杂,但是数据利用率高。泛化技术实现简单,隐私保护效果好,但是数据利用率低。随机扰动技术实现方法简单,数据利用率低。对于社会网络隐私保护,由于其数据的独特性,传统的隐私保护技术已不能直接应用到社会网络中,但是其隐私保护的基本思想仍可以借鉴。本论文提出的利用节点拓扑属性向量泛化(即节点拓扑属性向量泛化)方法主要基于两方面的技术:K匿名化技术和泛化技术,该方法的创新之处在于两点。一是利用节点的结构特征(如度信息,最短路径长度等)将节点向量化,为后续聚类做准备。基于顶点的聚类方法,通常考虑节点所代表的个体的信息,如个体年龄、收入、身体状况等信息来聚类。而该方法是利用节点的结构特征,如度、最短路径长度等。二是将K匿名化技术和泛化技术结合起来,提出“先制止”匿名化的方法,保证满足K匿名化。研究隐私保护时,经常要考虑数据利用率和隐私保护程度之间的平衡。本论文利用最短路径调和平均值损失率和度序列损失率(论文中详细介绍)作为评价指标。在进行试验时,利用Pajek生成不同节点个数的随机网络,分别研究节点拓扑属性向量泛化技术中的各个影响因素,如向量化维度的选值、不聚类簇个数、匿名化K值等。最后,分别对两个真实网络NetScience和USAir利用该方法进行隐私保护,试验结果表明,利用该方法泛化网络,最短路径调和平均值损失率和度序列损失率都较小。节点拓扑属性向量进行隐私保护优点在于实现简单,能同时考虑节点的多个属性,隐私保护效果好等;但也存在很多不足的地方,比如聚类簇个数敏感等,值得进一步研究。
其他文献
可视语音的合成是近年来多媒体信号处理中的一个研究焦点和难点.随着智能人机交互应用的兴起,人们需要在交流过程中融合多种表达方式,多种行为模态以增加信息的含量,提高信息
本文对于“校园网络管理系统”中故障管理模块的整体框架和具体功能作了详细的描述和分析,设计并实现了如下故障管理功能:故障轮循、故障接收、故障日志和智能故障诊断。 在
数据挖掘又称数据库中知识发现,是从大量数据中用非平凡的方法发现有用的知识。分类是数据挖掘中的一项非常重要的任务,在商业、金融、电讯、DNA分析、科学研究等诸多领域具有
超立方体网络是迄今为止最为重要和最具吸引力的网络拓扑结构之一。本文通过对当前网络中的拥塞控制、流量控制和负载均衡等问题的深入研究,提出和设计了基于负载均衡的超立方
学位
中文版面(特别是中文报纸版面)中文本域与非文本域经常交错嵌入。非文本域对文本域的提取会造成干扰。针对这种特点,本文提出了一种非文本块优先的中文版面分析方法。首先提取
随着软件的复杂度和规模不断增长和扩大,业界对于软件的可重用性和可维护性的要求也越来越高。基于组件的软件具有较高层次的可重用性和高度的可维护性,因而成为了近年来软件开
供应链管理为企业提供了一种新的管理理念与模式,它所强调的快速反应市场需求、战略管理、高柔性、低风险、成本--效益目标等优势,吸引了许多学者和企业界人士研究和实践它,
随着多媒体数据的日益发展和普及,多媒体相关技术的研究成为当前信息领域的一个热点,特别是基于内容的图像检索(Content Based Image Retrieval,CBIR),形成了一类新的前沿课
随着计算机网络和Internet的快速发展,全球信息化已成为人类社会发展的大趋势,但由于计算机网络具有联结形式多样性和网络开放性等特征,致使网络容易受黑客恶意软件和其他不