论文部分内容阅读
近年来,随着信息技术的飞速发展,兴起了各种各样的在线社交网络服务。它们在改变我们的工作和生活方式的同时,也对社会、经济和科技的发展产生着重要的影响。社交网络如同一面面的镜子反映着现实社会的方方面面,为我们研究人类社会中的各种现象提供了宝贵而丰富的资源。为了挖掘社交网络中蕴藏的价值,人们展开了各种各样的社交网络分析。与此同时,作为真实社会的写照,社交网络数据包含了大量的个人信息。在进行社交网络分析的同时,我们需要对数据中可能涉及的用户隐私进行保护。目前,国内外面向社交网络分析的隐私保护研究已经取得了不少成果,但总体来看仍处于起步阶段,还存在着许多局限和不足。在非交互式社交网络分析中,现有的研究工作大多只考虑了单次发布的社交网络数据。面对连续发布的社交网络数据,一方面,现有的匿名化方法无法很好地保护用户隐私,也不能满足对匿名数据进行演化分析的需要;另一方面,现有的去匿名化方法中固有的不确定性被放大了,存在较大的改进空间。在交互式社交网络分析中,现有的研究工作大多基于传统数据库领域中的差分隐私框架,并不能很好地适用于社交网络这样的图数据。特别地,面对交互式子图分析,基于差分隐私的解决方案要么只能允许有限的子图计数查询,要么需要添加过大的噪声而导致查询结果的可用性很差。本文试图解决当前研究领域存在的这些问题,以填补其中的空白。首先,我们研究了面向动态社交网络数据的去匿名化问题,并提出了一种针对连续发布的社交网络数据的去匿名化方法。特别地,我们提出了贯穿和贯射的概念,能够方便地表示和处理发布数据之间的关联;循环匹配技术的使用则显著地提高了去匿名化结果的准确度。然后,我们研究了面向匿名社交网络数据的演化分析问题,并提出了一种重建匿名社交网络之间节点关联的方法,使得演化分析成为可能。该方法对已有的匿名化算法和已经发布的匿名社交网络数据是透明的,即它们无需进行任何修改或重新发布。最后,我们研究了交互式子图分析中的隐私保护问题。为了对抗图的重构攻击,我们提出了一种根据攻击者发起的查询函数来推断其知识的方法,并以之为基础定义了查询函数之间的无缝关系。基于该关系,我们提出了无缝隐私框架,在允许任意子图计数查询的同时大大地降低了保护隐私所需的噪声幅度,从而提高了查询结果的可用性。