基于扰动的网络流量数据隐私保护方法研究

来源 :北京交通大学 | 被引量 : 1次 | 上传用户:heermeisi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术、大容量存储技术的迅猛发展以及数据共享范围的逐步扩大,数据的网络化与透明化成为不可阻挡的大趋势,用户在网络中产生的数据信息被频繁地用于数据挖掘,导致隐私泄露等网络安全问题层出不穷。因此,大数据环境下的网络数据隐私保护成为当前重要的研究方向,力求实现数据的可用性和隐私的安全性之间的平衡。基于对网络流量数据挖掘技术和隐私保护模型的研究,针对网络流量敏感属性泄露问题,本文提出了基于扰动的网络流量数据隐私保护方法,并且从数据可用性和安全性两个方面进行衡量。本文的研究内容主要分为以下三个方面:(1)针对网络流量数据含有的冗余属性对分类挖掘效果的影响,提出了一种基于信息熵的网络流量属性特征选择算法,提取了与应用类别相关度高且属性之间冗余性小的特征子集。实验证明筛选出的特征子集能够准确地表达原始数据的特征并可有效地应用于分类。(2)为了防止网络流量属性中的敏感数据泄露,结合属性的概率分布,设计了一种基于扰动的网络流量数据隐私保护算法。该算法在生成与原始属性独立同分布的数据基础上,进一步采用序映射来恢复属性之间的对应关系,以实现在保护数据安全性的同时提高数据的可用性。(3)从数据的可用性和安全性两方面验证基于扰动的网络流量数据隐私保护算法的有效性。实验证明,扰动后的数据与原始数据相比,仍然能够保持较高的分类准确率,即保持了数据的可用性;同时数据之间的相似性较差,能够较好地隐藏原始数据,即数据的安全性得到了有效保障。综上,本文针对网络流量分类方法进行了分析,设计了基于信息熵的特征子集选择算法,并重点提出了针对网络流量数据的隐私保护算法,最后在真实网络流量数据集进行了仿真验证。实验证明,使用该算法处理后的网络流量数据能够兼顾数据的安全性和可用性,缓解了已有算法在两者性能中的矛盾,可以有效地解决网络流量在数据挖掘过程中的隐私泄露问题。
其他文献
本文将首先介绍刑法人格主义的思想的由来,在此基础上提出将人格导入犯罪预防活动预防犯罪的具体建议。 This article will first introduce the origin of the idea of ​
在知识点"新民主主义社会是一个过渡性的社会"的教学当中,要突出"过渡性",可以分三个步骤来教学:第一步,要把新民主主义社会的经济结构状况、阶级结构状况及文化结构状况讲清楚;第
地下工程结构防水一直是人们关注的话题,也是日后工程投入运营阶段,易出现质量问题的环节。通过对我国高烈度区第一条沉管隧道——天津市滨海新区中央大道海河隧道工程暗埋段
从目前城市管理行政执法工作的现状来看,虽然经过多年的努力,城市管理行政执法当中多头执法、暴力执法、暴力抗法以及滥用职权等问题得到了有效解决。但是在全新的城市化背景
南京民国建筑由于其兼具卓越的历史文化价值和现实的再利用性而成为南京城市发展中不可多得的建筑资源。本文基于典型案例的调研发现有些民国建筑的建筑性能已经很差,无法为
<正>菠萝(Ananas comosus)在固体培养基上进行体细胞胚发生时,由于不断有数量较多原球茎和不定芽等分化导致肉眼很难将它们与胚胎发生植株之间区分开来。因此,研究菠萝胚性细
目的了解青烟威荣城际铁路新建车站供水卫生情况,为车站供水卫生管理提供科学依据。方法收集分析2014、2015年青烟威荣城际铁路新建车站的供水验收检测报告。结果部分车站生
陕西省华阴市是国家5A级风景名胜区西岳华山所在地。近年来,该市以发展全域旅游为统揽,不断优化畜牧业布局,带动畜牧业转型升级,促进一二三产融合,实现了畜牧业的安全环保绿
为了满足人们对高能量密度二次电池的迫切要求,高能锂离子电池(LIBs)和锂硫电池(LSBs)被广泛关注。锂离子电池具有重量轻、循环寿命长以及自放电小等优点,被认为是一种具有发展前
随着高职院校不断扩招和高等教育的大众化发展,高职院校毕业大学生数量急剧增多,学生的就业问题已成为重要的社会问题。从高职大学生就业现状入手,在系统分析高职大学生就业