论文部分内容阅读
社交网站在现代生活中发挥着重要作用,越来越多的用户将这些社交网站融入到他们的日常活动中。社交网站使用量的巨大增长导致在线共享信息的爆炸性增长,但共享信息的正确性和合法性却可以被操纵。越来越多的隐私泄露事件被新闻媒体报道,用户对隐私保护也日益关注。用户在社交网络中的行为和用户的隐私息息相关,这使得用户面临着身份盗窃,经济损失甚至身体伤害等重大风险。虽然社交网站允许用户对自己的隐私信息进行设置,但很少有用户关注这一点,因此需要隐私风险评估模型,对用户隐私的泄露风险进行评估,及时预警,防止隐私泄露的情况发生。目前,国内外针对社交网络隐私的研究中,大多数集中于隐私保护方面,研究人员通常从用户的数据、社交属性以及社交关系等多个方面解决用户的隐私保护问题。但是,对于社交网络中用户隐私发现和隐私风险评估的研究相对较少,社交网络中哪些信息可以被定义为隐私信息仍然缺乏统一标准,在关于隐私风险评估的研究中,大多数研究人员仅选取少量角度对隐私风险进行评估,难以保障隐私风险评估的全面性。因此,对社交网络中存在哪些隐私进行评定,同时全面地评价用户的隐私风险,从隐私信息产生的源头对用户提供预警,是一个重要的研究方向。本文的主要内容及创新点为:1.分析了存在于用户资料以及文本内容中的隐私信息,并构建了用户资料和文本内容的隐私体系;2.基于层次分析法和灰色理论构建模型,评估用户资料中存在的隐私风险;3.构建隐私文本分类器用于隐私文本检测,并以此为基础评估文本内容中的隐私风险。本文针对目前隐私风险评估范围不全面的缺点,提出了隐私风险评估模型,从用户资料信息和文本内容信息两个角度,对隐私风险进行全面评估。同时,针对文本内容信息非结构化且不利于量化的特点,基于信息熵提出了文本内容信息隐私的量化方式,能够有效用于隐私风险的评估。通过对大量实际数据的隐私风险进行评估,并结合实例验证的方式,结果显示,本文提出的隐私风险评估模型能够有效评估社交网络用户的用户资料隐私风险和文本内容隐私风险。该模型能够运用于社交网络用户隐私风险的评估过程中,及时对用户隐私泄露的风险进行预警,保护用户隐私安全。本文的研究能够为隐私发现,隐私保护等过程提供建设性意见。