基于数据净化的敏感信息保护策略研究

被引量 : 0次 | 上传用户:xingzhe009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的快速发展,为了有效地从海量数据中提取有价值的知识,数据使用者采取多种数据挖掘的技术手段去处理数据拥有者发布的信息。数据挖掘技术的快速发展一方面为企业带来了丰厚的利润,但另一方面随着数据挖掘技术的日益完善,挖掘工作也增加了数据库中潜在敏感知识暴露的风险。显然,数据拥有者粗鲁的拒绝发布数据在当今经济全球化的大背景下是行不通的,也不利于企业间商业合作的可持续发展。为了实现企业间商业共赢,共享数据库成为了必要的先决条件。因此,如何在不影响各方利益的同时,既完成数据挖掘任务,又要保证数据库中蕴藏的敏感信息不被泄露,具有重要的现实意义及理论意义。本文针对不同的企业隐私保护需求,设计了基于项的数据净化的隐私保护策略。对于关注发布后的数据库的精度和信息损失的数据拥有者,本文设计了基于模型的隐藏策略;对于具有不同风险偏好的数据库拥有者,本文设计了基于启发式算法的隐藏策略。不同于简单隐藏敏感属性的隐私保护方法,本文提出的所有隐藏策略针对的保护对象为数据库中蕴含的敏感信息,由于数据库蕴藏的商业竞争知识通常以敏感信息的形式为代表,所以本文的研究策略更具备现实意义。首先,针对敏感频繁项集隐藏问题,本文建立了一个约束满足模型。特别的,面对企业对精度与损失的多重需求,设定多目标优化0-1整数规划模型。在分析模型过程中不仅得出定性及定量的最优策略分析还提出了一种将非线性约束转为线性约束的技术方法。此外,利用项集的边界理论对原始模型进行了修正,得到的基于修正模型的隐藏策略大幅度提高了原策略的执行效率。其次,针对具有不同风险偏好的数据拥有者,本文在引入暴露风险的概念之后,提出了基于启发式算法的频繁项集隐藏策略。通过定量化分析净化操作对非敏感信息的影响,寻求最优隐藏策略。通过数值实验发现本文的隐藏策略在信息损失方面优于现存的启发式算法。在研究过程中,本文借鉴了已有的研究成果,深入研究数据挖掘中隐私保护方法与净化策略,为企业在数据共享阶段提供了修改数据库的理论支撑、决策支撑和实践指导。
其他文献
公差与配合作为一门工科院校机械类专业的必修课程,其重要性不言而喻。但是由于这门课程本身理论性强,概念定义繁杂,学生学起来不易理解并感到枯燥。然而利用多媒体,可以把声音、
沙棘具有悠久的药用历史,沙棘油根据来源不同分为沙棘籽油和沙棘果油。沙棘果油和沙棘籽油均含有丰富的不饱和脂肪酸、生育酚、β-类胡萝卜素和甾醇类物质。研究表明,沙棘油
以非ST公司为参照系,分析了退市制度中的不合理因素如何造成ST公司会计行为的扭曲(主要表现为过度减值),以及这些扭曲的会计行为如何进一步影响公司的信息披露质量。研究表明
温拌沥青技术是一门新兴的绿色筑路工程。与传统的HMA相比较,WMA的拌合与压实温度相对较小,能耗和有毒有害气体排放量较小,同时具有良好的路用性能,应用前景非常广泛。近年来
以我国2003~2010年的A股上市公司为研究样本,分析了管理者过度自信与企业投资行为之间的关系及其通过投资决策对企业绩效产生的影响。研究发现,管理者过度自信的企业与管理者
随着慈善事业的蓬勃发展,社会私募活动无疑扮演着越来越重要的角色,日渐构成了社会保障体系的一个有机组成部分,但不可忽视的现实是在我国社会募捐活动中,相关法律制度的健全及完
随着信息化技术的高速发展,教育的信息化已是必然的趋势。信息化教育过程中,教育质量的高低,教学信息化程度是关键;信息化能否优化教学,教师的信息素养是关键。高校教师作为学校教
本文主要研究了低密度校验(LDPC)码译码算法的优化问题和提高抗突发差错性能的方法。为获得LDPC码译码性能和复杂度二者间的优化平衡,本文提出了基于概率计算的加权比特翻转(
本文将着重探讨国内英语教师对于反思性教学的理解,并且试图找出一些可能会影响教师进行反思性教学的因素。文章同时研究了教师在职业发展中对于反思性教学态度。本文的目的是
<正> 中华民族总是自豪地称自己是“黄炎子孙”,“华夏裔胄”。但“黄炎”从何而来?“华夏”因何而起?却是古今异词,莫衷一是。本文拟根据自己所接触到的古文献和考古资料,提