论文部分内容阅读
随着大数据技术的创新和应用,全球正式进入“数据驱动”时代,对国家和企业而言,数据已成为重要的战略资源。然而,诸如云计算、物联网等技术的出现,在推动大数据技术发展的同时,也给数据资源带来了层出不穷的安全隐患。近些年来,数据泄露事件频出,规模较大,数据安全和隐私保护的形势十分严峻,不容乐观,引起社会各界越来越多的关注。大数据时代离不开数据的开放共享,如何实现数据的“可用不可见”,成为当前亟待解决的问题。本文基于矩阵变换的技术路线,对大数据环境下隐私保护的计算外包和认证外包的关键技术进行研究,主要完成了以下工作:1.提出了一种基于特别构造可逆矩阵的矩阵乘法安全外包方案SDIM。矩阵乘法(MMC)作为最重要的基本运算之一,在科学界与工程界有着广泛应用,且在大数据分析的诸多算法中,有很多算法可以转化成MMC任务,如线性回归、主成分分析等。基于此,本文首先研究了MMC的安全外包方法,基于特别构造的可逆矩阵,设计了一种通用的数据外包加密方案SDIM。该方案既包含乘法扰动又包含加法扰动,修正了现有基于随机置换矩阵的通用加密方案RPM的内在安全缺陷(即泄露原始数据中零元素的统计信息且不满足计算不可区分性),增强了数据的隐私安全性;同时SDIM方案采用最优矩阵链乘法以降低数据加解密的计算复杂度,在效率上与RPM方案表现相当,足以满足实际应用需求。2.以SDIM方案为基础,构建了隐私保护的线性回归和主成分分析的外包计算协议。线性回归(LR)和主成分分析(PCA)是大数据分析领域的典型机器学习算法,在云计算环境下有着广泛的外包计算需求。我们以SDIM方案给出的MMC安全外包计算为基础,构建了隐私保护的LR和PCA安全外包协议,并且与现有的基于矩阵变换的隐私保护外包方案相比,基于SDIM的外包方案具有与之相当的效率,证实了SDIM方案在以MMC计算为基础的复杂机器学习任务安全外包计算中的适用性。3.提出了一种高效的隐私安全性增强的生物认证方案。作为保障大数据系统接入安全的一种重要技术,生物认证近年来得到了广泛地应用。然而,生物认证在提供安全便利的认证手段的同时,也对个人的隐私安全提出了严峻的挑战:由于生物特征具有不可撤销的特点,故生物模板一旦泄露将给用户造成无法挽回的损失。面向生物认证过程中的隐私保护需求,我们提出了一种基于高效矩阵变换的隐私保护生物认证方案。该方案在将生物模板的匹配问题看作加密向量的内积大小判定问题的基础上,通过在矩阵变换过程中引入更多的随机性,有效提升了方案的安全性水平;利用正交变换与向量内积的性质对计算进行加速,降低了方案的计算复杂度,使其更适合于大规模生物特征数据库的实际应用场景。安全性和效率比较表明,我们的方案比现有方案更加安全高效。