满足差分隐私的频繁子图挖掘算法研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:otherwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,数据挖掘技术已经成为研究人员从数据中提取有用知识的重要工具。频繁模式挖掘是数据挖掘领域中的一个重要课题,用于得到事物之间的关联特性。频繁子图挖掘是频繁模式挖掘的一种具体形式,它从图数据集合中获得频繁子图结构,在图数据的分析中具有重要的意义。然而,如果这些子图中涉及敏感信息,直接发布或分享这些频繁子图就有可能造成个体用户信息的泄露。为了解决上述问题,本文提出了一种满足差分隐私的频繁子图挖掘算法DFG (Differential Private Frequent sub Graph mining algorithm)。DFG使用了一种两阶段算法的模型。第一阶段为频繁子图选择阶段,DFG算法在这一阶段中按照逐渐增大子图边数的方式挖掘频繁子图,并使用了二分估值算法和条件指数机制降低挖掘过程中所引入的噪音量;第二阶段为噪音支持度计算阶段,DFG算法在这一阶段中对频繁子图建立网格结构,并利用基于噪音量反馈的多路径建立算法得到覆盖网格的路径集合,最后通过计数累加算法和噪音合成规则得到每条路径中频繁子图的噪音支持度。理论分析表明DFG算法满足ε-差分隐私保护;后续的对比实验结果表明DFG算法的数据效用和运行效率均优于现有的满足差分隐私的频繁子图挖掘算法。本文还说明了 DFG算法可以被扩展到频繁模式挖掘中,并根据频繁项集挖掘的特点对网格结构进行优化,提出了 DFISL(Differential Frequent Itemset mining algorithm based on Sub Lattice)算法。实验分析表明DFISL算法的数据效用比现有的PFP-growth算法和DiffFPM算法更高。
其他文献
0~6岁是人大脑结构和身体机能发展最为旺盛的时期,而这个时期也是人的个性、习惯形成的关键期。曾经听一位成功人士说过这样的一句话:“习惯决定命运”。是的,这句话也并不是没有
近些年来,浙江省乐清市农民专业合作社发展十分迅猛,截至2007年底,乐清市登记在册的农民专业合作社170多家,注册资金3400多万元,入社社员近1万人,带动农户42000户。然而,这些专业合
2009年3月,中共中央、国务院颁布了《关于深化医药卫生体制改革的意见》(中发[2009]6号),这次新医改将公立医院改革确定为五项重点改革内容之一,着力改革公立医院补偿机制与
本期案例:内蒙古兴安盟农合农业有限责任公司成立时间:2008年3月推荐理由:兴安盟农合农业有限责任公司用实践告诉我们:农民专业合作社采取以土地折股入股、实现合作经营的形式。