基于规则隐藏的聚类隐私保护模型及算法研究

来源 :河北工业大学 | 被引量 : 4次 | 上传用户:jane_89
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几十年来,随着信息技术的发展,企业的运作方式发生了深刻地变革,数据信息流成为了企业生命的主线。然而在这种情况下,人们往往担心隐私被泄露而拒绝提供信息资料或提供虚假的信息。所以保护隐私程度的高低将直接关系到是否能够收集到足够真实的信息,从而关系到挖掘出来的信息是否可靠有用。于是,隐私保护便成为人们关注的焦点。本文建立了一个隐私保护算法的分类框架,通过对该分类框架的研究分析,发现了目前研究中的空缺——基于规则隐藏的聚类隐私保护,并针对这一空缺进行研究,提出了一种新颖的聚类隐私保护规则隐藏的模型及算法,进行了实验仿真,验证了算法的有效性。本文的具体贡献有如下几个方面:第一,本文提出了新的隐私保护算法分类框架,从应用类型、技术策略、隐藏对象和适用算法四个维度对隐私保护算法进行分类。在此基础上通过文献研究,分别从这四个维度对现有的主要隐私保护数据挖掘算法进行了分析比较,找出了目前研究中的空缺——基于规则隐藏的聚类隐私保护。第二,针对目前的研究空缺——基于规则隐藏的聚类隐私保护,提出了基于规则隐藏的聚类隐私保护模型,包含:数据预处理,聚类规则隐藏和算法评价三部分。首先,在数据预处理中,采用数据规范化,k-means聚类算法,轮廓系数法等方法,对原始数据进行预处理,目的是得到聚类规则隐藏算法所需要输入的变量。之后,使用添加噪声的办法,将数据进行几何平移,以达到隐私保护的目的。聚类规则隐藏算法包括三个必要的过程:(1)确定敏感对象;(2)确定噪声矢量;(3)根据前一步定义的噪声矢量,使用几何平移函数将数据进行修改。最后,依据评价指标对结果进行评价,判断运算结果的优劣。评价指标分别为:计算复杂性、隐私保护效果和准确性。第三,使用两组实验数据,并进行仿真实验,证明了算法的有效性。
其他文献
本文主要研究高技术产业集聚及其对区域创新效率的影响。论文首先对产业集聚及其测度相关文献、区域刨新效率测度相关文献进行了较为系统地回顾、分析和评述,阐述了区域创新
新型工业化、自主创新和中小企业的发展是近年来管理科学界的研究热点,三者的任何结合与交叉都是研究的重点。目前,我国正处在新型工业化范式演变的关键时期,坚持自主创新,不断加
学位
随着信息技术的发展和经济社会信息化进程的加快,电子商务进入繁荣发展时期。电子商务中的商品规模急剧增加,用户发现满意商品的困难增大,“信息过载”等问题日益严重。个性
传统控制权市场理论常侧重于研究控制权转移事件对公司绩效的影响效应,近年来,研究者发现:不但股权高度分散的美国存在适度集中的现象,而且大部分国家(地区)都具有集中的所有权结
我国上市公司资本结构与绩效的研究是经济发展的必然产物,随着我国市场经济的不断完善,公司制度的不断规范,企业资本结构的合理性探讨成为了理论界和实务界的研究热点。 现代
本文通过加入搜索行为能力对动态网络结构下的演化少数派博弈模型(EMG)进行深入研究。在本文的研究中加入动态网络结构模型,个体得分低于阈值时可以通过断掉表现差的个体的连
云计算使得IT资源能够象水、电、气、通信一样按需使用。近年来,随着云计算的兴起,云服务定价策略的研究已成为学术界和产业界共同关注的焦点。目前,对云服务定价策略的研究多集中单方定价,即只考虑提供商利润最大化,而忽略用户的体验。此外,产业实践中,分级定价也是提供商普遍采用的策略,但针对云服务分级定价策略的研究还很少。本文从一个长期、动态的视角,研究了考虑异质用户需求的分级定价策略。将垄断市场中分级云服
备件管理是设备管理的重要组成部分。如何在提高设备的使用可靠性、维修性和经济性的前提下,尽量减少相关费用和资金占用,是备件管理的目标。备件管理与企业的正常生产和经济
企业技术研发联盟是指由两个或两个以上的企业组成、共同进行研发工作,将研究成果直接转移给成员企业且进行研究成果商品化,并通过协议、契约而结成的优势互补、风险共担的经济网络组织。它能够帮助企业尤其是高技术企业实现低成本、高效率,缩短新产品、新技术的研发周期,因而在市场竞争激烈、市场需求多变的环境下得到广泛发展,成为现代企业技术研发和创新的最主要组织形式。在技术研发联盟中,互补性的技术或知识共享和专业化