论文部分内容阅读
近年来,各种社交软件的兴起,网络通信技术正处于突飞猛进的状态,我国对5G重点关注与投入,使得5G建设在我国正如火如荼的展开。5G网络相较4G网络在网络通信速度,网络实时性以及稳定性上都有无可比拟的优势。目前社交网络的数据量相比以前具有更加庞大的特点。5G的到来也使得更多的人加入到互联网中来,使得社交网络存储了大量的用户数据。因此,对社交网络数据来进行数据分析与挖掘要比传统数据分析方法来的更加科学效果更好,但是,对社交网络进行发布会造成个人隐私泄露等问题,所以,在为数据挖掘目的(科学研究、市场营销、决策支持等)发布数据之前,需要进行匿名化处理,用以保护社交网络中的用户隐私不被攻击者获取。首先本文针对于社交隐私动态变化的特点,基于三元闭包原则的特殊性质提出了潜在边的概念。三元闭包在社交网络中是一个建立用户之间联系的自然机制,通过建立三元闭包的网络生长模型可以使社交网络社区自然的出现。如果在同一个社交网络图中,两个人有一个共同的朋友,这两个人之间就存在潜在边。通过对原始社交网络图加入潜在边,能够一定程度的预测社交网络的变化情况,而且对不同条件下的社交网络图,我们可以通过调整加入潜在边的数量,达到不同程度的隐私保护效果。然后,本文针对如今的社交网络保护方法的中图数据效用较差的缺点,提出了将社交网络图转化为不确定图的方法,达到了修改社交网络图中的图属性的效果,达到了在保护社交网络图隐私的同时使得生成新图的数据效用较强的目的。主要方法是对加入了潜在边后的社交网络图中部分边集注入不确定性,使得新图的图节点的度,边存在性都发生改变,攻击者将难以准确的找到攻击目标,从而达到对社交网络图的隐私保护的效果。因为不确定图的特点,使得该方法在对原始图进行修改后图效用的损失较小。最后,因为不确定社交网络图的特殊性质,为了度量不确定社交网络图中节点的属性,本文对应于确定图中节点度的概念,提出了不确定图中节点的度的计算方法,并使用该方法衡量了生成的不确定社交网络图的数据效用。另外为了衡量算法对社交网络图的隐私保护效果,本文引用了边熵这一特殊的概念来衡量该算法的隐私保护能力。实验结果显示,该算法具有一定程度的隐私保护能力时算法对图数据效用的破坏也较小,并由于引入了潜在边,对动态社交网络也具有较好的保护效果。