基于关联规则挖掘的同态加密算法研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:yujing4953
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据成为国家基础性战略资源,许多企业和组织希望从海量数据中取得经济利益,并为用户提供便利。对于大多数企业和组织来说,他们没有处理海量数据的能力。因此,将数据挖掘任务外包给云计算服务机构有效地解决了这些企业和组织计算和存储容量不足、资源利用不足和资金投入等问题。但随之而来新的安全隐患,核心问题是数据所有者不希望自身敏感信息被别人知道。因此,隐私安全问题是海量数据挖掘技术应用的主要瓶颈之一。频繁项集和关联规则挖掘技术作为数据挖掘最重要技术之一被广泛应用于商品推荐系统、金融行业预测中和医疗数据分析中。在这些应用中对隐私保护要求较高。本文针对外包关联规则挖掘这一场景,通过对经典的Paillier同态加密算法进行加强,使其满足同态乘法,从而能够对密文处理复杂的计算,并提出完整的隐私保护关联规则挖掘方案。主要工作如下:(1)在原始Paillier同态加密算法基础上对其进行加强,利用Paillier的加法同态性质和数乘同态性质,实现乘法同态计算从而满足全同态加密,并设计了安全比较方案。改进后的Paillier同态加密方案称为FH-Paillier同态加密方案。与原始Paillier同态加密算法相比,在保留原有安全性的条件下,可以在更复杂计算场景下应用。(2)基于FH-Paillier加密算法,提出了完整的隐私保护外包关联规则挖掘方案。方案通过插入虚假数据扰乱原始数据库的信息,可以应对频率分析攻击。并使用FH-Paillier同态加密算法加密数据标签值,保证敏感信息不被泄露。频繁项集和关联规则的挖掘采用基于Map Reduce框架改进的并行算法MREclat对数据进行挖掘,该算法在各个站点之间无需通信,并且I/O次数较少。通过理论和实验对提出的方案进行反复论证和分析,实验表明,该方案具有较高的安全性和效率。(3)针对Paillier加密算法在加密和解密时可能出现计算过载,基于中国剩余定理对Paillier加密算法进行改进,研究并提出了一种改进的加密和解密方法。具体来说,利用中国剩余定理提升加密和解密过程的运算效率,并证明了算法改进后的理论正确性和准确性。实验结果表明,该方法具有较高的解密速度。
其他文献
脑网络分析已广泛应用于神经影像领域的研究。传统功能连接网络大多是基于两两相关构建大脑区域之间的二阶关系,为有效构建大脑区域之间的高阶交互关系,基于超网络的脑功能构建方法被提出。超网络是基于超图概念下的复杂网络,超网络中的超边可用来表示多个脑区之间的交互作用。超网络是根据静息态功能磁共振成像时间序列通过稀疏线性回归模型构建。现有的稀疏线性回归模型大多是采用套索的方法解决的。虽然套索方法应用广泛,但也
小规模数据集和有限的带标签样本是医学成像领域的主要挑战。训练成功的深度学习算法需要大量的有标签数据作为支撑,但由于医学图像数据难以获取且标签注释需要昂贵的人工成本,这大大限制了其在医学领域中的应用。在医学成像任务中,高级放射科医师会根据他们的专业领域知识制作病变标签,但是医学图像的大多注释都很耗时。当数据匮乏的时候,神经网络极易出现过拟合问题,这种现象在小规模数据集上尤为明显。传统的图像数据增强方
近年来,随着电子商务的不断发展,用户评论已成为各大线上消费平台的重要组成部分,其往往反映了用户的态度、意见以及情感等大量有价值的信息,能很好地进行商业反馈。因此,如何从这些评论文本中高效地提取有用信息,对消费者、商家以及消费平台都具有重要意义。现有研究主要通过“粗粒度情感分析”和“细粒度情感分析”两个方面来实现对文本信息的情感分析研究。粗粒度情感分析主要计算给定文本的整体情感倾向,细粒度情感分析则
近几年,卷积神经网络在医疗领域发挥着越来越大的作用,解决了医学上很多棘手问题,将卷积神经网络应用在医疗图像识别方面,可以很大程度上提高图像识别率。糖尿病视网膜病变在实际诊断中会出现病变特征难以用肉眼区分,识别率较低,并且依赖于眼科医生的临床经验等问题。目前,使用卷积神经网络对糖尿病视网膜病变进行分类可以为医生提供可靠的判断依据,本文提出了一种基于注意力卷积神经网络的方法对糖尿病视网膜病变进行分类,
在音频信号中嵌入所有者的有效版权信息的技术称为数字音频水印技术,这种技术可以有效的解决数字音频的版权问题,已经成为信息安全领域内的重要研究之一。而且同步问题对于音频信号的研究十分重要,所以音频水印技术的发展较慢;随着互联网技术的不断发展,大量出现的各种各样的破解工具导致了数字音频的被侵权问题越来越严重,如今对音频水印算法的性能也就有了更高的要求。但是,由于音乐音频类型的多样性,对于现有的基于频域的
煤炭在我国的发展中占据着重要的战略地位,因此煤矿的安全开采对于我国的社会和经济发展都具有重要的意义。随着计算机行业的迅速发展,使用智能设备监控煤矿井下的开采以及员工生命安全都取得了巨大进步。但是由于煤矿井下不是非常理想的环境等原因,对管控等技术的发展主要遇到两个瓶颈。首先是监控设备采集的图像照明度普遍偏低并且受到较大噪声干扰,其次矿道较为狭长,在目标跟踪过程中容易出现目标丢失的现象现有的目标跟踪方
随着多媒体网络和GPS全球定位服务系统的发展和相关应用普及,海量且多维度的数据呈现爆发式的增长,包括大量带有关键词属性的空间文本对象数据。目前主要通过空间数据库查询处理技术对这些数据进行分析处理,其中最重要的核心问题就是空间关键词查询技术,它能够利用兴趣点本身的空间属性与文本属性并综合考虑他们与查询之间的相关性,快速返回给用户满足查询需求的兴趣点。现有的空间关键词查询技术主要集中在经纬度坐标之间的
物联网的飞速发展使其部署在边缘的各种终端设备数量迅速增长,通过终端设备收集与传输的数据量也在增加,而物联网终端设备在与平台进行数据传输的过程中,大多缺少适合于物联网环境的高效身份认证和加密通信机制,因为传统互联网中的很多经过人们长久检验的安全机制由于终端设备的计算能力限制等其他特性而并不适用于物联网设备。为了确保大规模部署在无人监管环境中的终端设备安全,本文对物联网环境下终端设备的安全入网方案、身
蛋白质赖氨酸乙酰化(Lysine acetylation,Kace)参与细胞的各种生理活动,与DNA修复和细胞信号传导等生物学过程密切相关,是最重要的翻译后修饰(Post-Translational Modifications,PTMs)类型之一。Kace在生物体中的动态调节,是保证各种生物功能正常进行的重要条件,而异常的Kace修饰将导致各种疾病的产生,如糖尿病、癌症和神经退行性疾病。因此,Ka
随着信息技术的飞速发展与互联网的普及,网络用户更加热衷于在互联网上发表自己的观点、态度,各类网络平台上积蓄着用户大量的评论文本信息,例如购物网站的商品评论、新闻网站的新闻评论、社交网站的社交评论等。这些评论文本信息中大都蕴含着互联网用户所发表内容的情感倾向,对互联网上这些带有情感色彩的评论文本进行整理分析,这对于各个行业都有重大效益。使用自然语言处理中的文本情感分析方法可以对这些带有情感色彩的评论