面向社区检测的局部随机化匿名方法的研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:king_wda
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着社会的快速发展,尤其是社交平台的兴起,越来越多的用户加入到线上社交平台,使得社会网络数据量迅猛增加,不但方便了个人及团体更好的进行交流,也方便相关科研机构对社会网络进行更细致的研究分析。但是,有些数据却不能直接提供给相关科研人员使用,因为数据中可能包含一些敏感信息,比如姓名、用户关系、工资等。如果直接对原始数据发布,有可能泄露用户隐私。因此我们在发布数据前必须对相应敏感数据进行隐私保护处理,但是这些隐私保护策略可能会很大程度上修改原始社会网络中的结构信息。因此,如何在数据的隐私保护和数据的效用性取得平衡是社会网络的一个热点问题。目前的社会网络数据发布方法主要是给定一个原始社会网络图,进行相应的隐私匿名保护后,直接发布。但是忽略了如下问题:(一)仅仅考虑隐私安全,没有考虑到社会网络图的信息改变量;(二)原始社会网络图中可能包含各个子社区,没有对相应的子社区的隐私安全做详细的考虑。以上两点使数据的实用性降低。发布的社会网络图越精细对于相关的社会网络分析者越有利,本文通过社区检测算法对划分后的子社区结构(结点的度)做相应的隐私保护分析,对面向社区检测的社会网络隐私保护做相应的研究。本文的主要工作如下:首先,通过分析当前的社会网络隐私保护方法,发现其不足。本文使用社会网络结构(结点的度)作为攻击者背景知识,传统的k度匿名方法以及随机化方法在隐私保护的过程中没有充分考虑原始社会网络的结构图,以及原始社会网络图中存在多个子社区,一些边的连接关系可以分为子社区内部的连接,子社区之间的连接。在进行隐私保护的过程中,可能会破坏原始社会网络的结构,比如一些社会网络结点的添加删除或者边的添加删除。在k度匿名以及随机化的过程中,可能会产生很多的不确定图,破坏了数据的实用性。其次,对于上述两种传统方法存在的不足,本文提出了一种新的保护子社区结构信息的局部随机化扰动方法。在该方法中:首先基于社区检测过程中,记录边介数。当社区检测完成之后,根据攻击者的背景知识(结点的度),判断是否有隐私泄露,如果没有,说明该子社区不存在隐私泄露问题,不做处理;如果有隐私泄露,判断隐私泄露结点所连接的边是否都在子社区内部,如果是社区内部的边,属于社区内的隐私泄露,则等概率删除或者添加边,运用随机化进行扰动;如果隐私泄露的结点所连接的边与另一个社区相连,说明该结点存在边介数,调整边介数被删除的概率,使其被删除的概率增大,然后在子社区间进行随机化处理操作。通过该方法,很大程度上保证了社会网络图的原始面貌,对于任意的子社区,在保证隐私要求的前提下,该子社区社会网络结构也得到了更好的保证,方便相关科研人员对发布的社会网络图进行相关的研究分析。最后,我们使用真实的数据集来验证本文所提方法的可行性和效用性,用此方法在保证隐私安全的同时可以更好的保证社会网络的结构特征。
其他文献
目的:探讨高级别宫颈鳞状上皮内病变(CIN2-3)患者宫颈环形电切术(LEEP)后病理阴性的相关影响因素。方法:选取自2011年3月至2012年12月间嘉兴市妇幼保健院因宫颈病变经阴道镜下活检
为合理确定人工栽培何首乌的最佳采收期,采用多指标综合评价分析方法,对1~3年生不同采收期何首乌样品进行了综合评价。结果表明:二苯乙烯苷含量以2年生11月中旬至12月上旬达
论文利用LDHs的板层元素可调变性和层间阴离子的可替换性,将Mg、Al、Zn、Ca、CO32-、硼酸根等多种具有良好阻燃效果的元素和基团,引入LDHs阻燃体系,采用双滴共沉淀法、离子交换
摘要:随着现代经济社会的不断发展和进步,土木工程逐渐发展成为拥有门类齐全、丰富内涵、结构复杂的施工学科。其施工质量管理工作以及控制工作是否能够顺利进行将会对施工质量产生直接影响。做好建筑及各类基础设施的建设土木工程是关键,做好土木工程项目的管理对于确保土木工程项目的建设质量和利润有着极为重要的意义。文章在分析我国土木工程项目管理的基础上对如何加强土木工程项目的施工管理提出了几点建议。  关键词:土
随着社会的发展,现阶段人们对于教育事业的要求开始变得越来越高。目前各大高校都非常重视大学生的双创教育,市场营销学作为商贸类专业的核心课程,传统的教学方法已经不适合