基于数据净化的敏感信息保护策略研究

被引量 : 0次 | 上传用户：xingzhe009

【摘要】

：

随着信息时代的快速发展,为了有效地从海量数据中提取有价值的知识,数据使用者采取多种数据挖掘的技术手段去处理数据拥有者发布的信息。数据挖掘技术的快速发展一方面为企业

【作者】

：

贺悦

【发表日期】

：

2013年期

【关键词】

：

数据挖掘隐私保护数据净化边界思想

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着信息时代的快速发展,为了有效地从海量数据中提取有价值的知识,数据使用者采取多种数据挖掘的技术手段去处理数据拥有者发布的信息。数据挖掘技术的快速发展一方面为企业带来了丰厚的利润,但另一方面随着数据挖掘技术的日益完善,挖掘工作也增加了数据库中潜在敏感知识暴露的风险。显然,数据拥有者粗鲁的拒绝发布数据在当今经济全球化的大背景下是行不通的,也不利于企业间商业合作的可持续发展。为了实现企业间商业共赢,共享数据库成为了必要的先决条件。因此,如何在不影响各方利益的同时,既完成数据挖掘任务,又要保证数据库中蕴藏的敏感信息不被泄露,具有重要的现实意义及理论意义。本文针对不同的企业隐私保护需求,设计了基于项的数据净化的隐私保护策略。对于关注发布后的数据库的精度和信息损失的数据拥有者,本文设计了基于模型的隐藏策略；对于具有不同风险偏好的数据库拥有者,本文设计了基于启发式算法的隐藏策略。不同于简单隐藏敏感属性的隐私保护方法,本文提出的所有隐藏策略针对的保护对象为数据库中蕴含的敏感信息,由于数据库蕴藏的商业竞争知识通常以敏感信息的形式为代表,所以本文的研究策略更具备现实意义。首先,针对敏感频繁项集隐藏问题,本文建立了一个约束满足模型。特别的,面对企业对精度与损失的多重需求,设定多目标优化0-1整数规划模型。在分析模型过程中不仅得出定性及定量的最优策略分析还提出了一种将非线性约束转为线性约束的技术方法。此外,利用项集的边界理论对原始模型进行了修正,得到的基于修正模型的隐藏策略大幅度提高了原策略的执行效率。其次,针对具有不同风险偏好的数据拥有者,本文在引入暴露风险的概念之后,提出了基于启发式算法的频繁项集隐藏策略。通过定量化分析净化操作对非敏感信息的影响,寻求最优隐藏策略。通过数值实验发现本文的隐藏策略在信息损失方面优于现存的启发式算法。在研究过程中,本文借鉴了已有的研究成果,深入研究数据挖掘中隐私保护方法与净化策略,为企业在数据共享阶段提供了修改数据库的理论支撑、决策支撑和实践指导。

其他文献

机械制造中基础类公差与配合动画设计与研究

公差与配合作为一门工科院校机械类专业的必修课程，其重要性不言而喻。但是由于这门课程本身理论性强，概念定义繁杂，学生学起来不易理解并感到枯燥。然而利用多媒体，可以把声音、

学位

尺寸链尺寸公差形位公差flash软件多媒体动画设计

沙棘油功效成分及药理功能研究进展

沙棘具有悠久的药用历史,沙棘油根据来源不同分为沙棘籽油和沙棘果油。沙棘果油和沙棘籽油均含有丰富的不饱和脂肪酸、生育酚、β-类胡萝卜素和甾醇类物质。研究表明,沙棘油

期刊

沙棘果油沙棘籽油功效成分药理功能

退市制度安排、过度减值与信息披露质量

以非ST公司为参照系,分析了退市制度中的不合理因素如何造成ST公司会计行为的扭曲(主要表现为过度减值),以及这些扭曲的会计行为如何进一步影响公司的信息披露质量。研究表明

期刊

退市制度安排过度减值信息披露质量中介传导效应

温拌沥青混合料在北京地区应用的技术研究

温拌沥青技术是一门新兴的绿色筑路工程。与传统的HMA相比较,WMA的拌合与压实温度相对较小,能耗和有毒有害气体排放量较小,同时具有良好的路用性能,应用前景非常广泛。近年来

学位

北京地区温拌剂温拌沥青混合料经济分析

管理者过度自信、企业投资与企业绩效——基于我国A股上市公司的实证检验

以我国2003~2010年的A股上市公司为研究样本,分析了管理者过度自信与企业投资行为之间的关系及其通过投资决策对企业绩效产生的影响。研究发现,管理者过度自信的企业与管理者

期刊

过度自信投资行为企业绩效

我国社会募捐及余额归属法律问题研究

随着慈善事业的蓬勃发展，社会私募活动无疑扮演着越来越重要的角色，日渐构成了社会保障体系的一个有机组成部分，但不可忽视的现实是在我国社会募捐活动中，相关法律制度的健全及完

学位

社会募捐赠与合同所有权归属

高校教师应具备的信息素养

随着信息化技术的高速发展，教育的信息化已是必然的趋势。信息化教育过程中，教育质量的高低，教学信息化程度是关键；信息化能否优化教学，教师的信息素养是关键。高校教师作为学校教

期刊

高校教师信息素养信息时代多媒体素养信息基础知识

LDPC码译码算法与抗突发性能的研究

本文主要研究了低密度校验(LDPC)码译码算法的优化问题和提高抗突发差错性能的方法。为获得LDPC码译码性能和复杂度二者间的优化平衡,本文提出了基于概率计算的加权比特翻转(

学位

LDPC译码算法突发差错瑞利衰落差错控制

外语教师反思性教学实践研究

本文将着重探讨国内英语教师对于反思性教学的理解，并且试图找出一些可能会影响教师进行反思性教学的因素。文章同时研究了教师在职业发展中对于反思性教学态度。本文的目的是

学位

反思反思性教学英语教学教师发展

黄炎华夏考

<正> 中华民族总是自豪地称自己是“黄炎子孙”,“华夏裔胄”。但“黄炎”从何而来?“华夏”因何而起?却是古今异词,莫衷一是。本文拟根据自己所接触到的古文献和考古资料,提

期刊

黄帝时代皇甫谧有熊国春秋时代《编年记》《史记·五帝本纪》

基于数据净化的敏感信息保护策略研究

其他学术论文