论文部分内容阅读
近年来,随着互联网技术的飞速发展,我们已经进入了大数据时代,大数据是依赖于互联网平台而产生的规模巨大的数据集,且有着海量规模、变化迅速、价值密度低、种类繁多等特点。在我们的日常生活中,随着各种数据在网络上肆意传播,接踵而来的是日益严重的用户隐私信息泄露问题,大大小小的公司或组织或多或少地都经历过来自于恶意应用、木马等互联网攻击,从而导致其用户数据流出。因此,隐私保护问题已经成为众多研究学者关注的热点问题。现有的隐私保护研究成果大多数都是针对静态社会网络中的静态数据,然而实际上,我们在社会网络中发布的数据是时时刻刻都在变化的,更趋近于动态社会网络。对于动态社会网络中规模较大、流动迅速的流式数据,目前采用的方法仅仅是直接应用静态数据的隐私保护算法,这样虽然在某一时刻能够很好的保护用户隐私,但是一旦攻击者利用发布在多个时间片下的数据进行联合攻击,那么就很容易暴露隐私信息。本文针对以上问题,提出一种面向动态网络的隐私保护模型。首先,提出了一种隐私风险主动监测机制,基于贝叶斯网络在分析不确定性问题的优势分析并预测动态社会网络在下一时刻的状态,根据概率模型推测用户隐私泄露的概率从而决定是否采取隐私保护措施;其次,对无法确定安全性的数据采用协同隐私保护算法,根据数据距离当下时刻的时间长短和敏感程度,将用户的敏感信息划分数据隐私空间,并对数据隐私空间内的数据采用相关典型分析算法找到敏感数据的替代值;最后,为了提高协同隐私保护算法的效率,每次对数据计算时,度量相邻时间片下数据项的相似性,从而能够依据数据项各个标签的权值的自适应调整来实现快速计算隐私保护参数值。基于提出的隐私保护模型,提出了详细的、系统的设计方案及具体算法,并设计了实验验证其可行性。实验表明在经过本文算法处理后的社会网络,其结构信息损失较少。