基于Spark的时空数据用户隐私保护查询优化算法的研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:dpf443398
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会生活的信息化的程度不断提高,每天的生活和生产中都在不断的产生大量的数据,现在已经进入了大数据的时代。数据作为一种资产,对它的存储和使用对未来的生产和生活拥有巨大的意义。近年来云计算技术和基于位置服务技术都得到了长足发展。云计算是大数据的有效支撑,它为大数据提供了基础设施,大数据需要弹性的计算环境,而云计算可以快速、自动地进行扩展以支持移动大数据环境下移动数据流查询处理的对规模动态变化、响应时间、处理能力等方面的需求;基于位置的服务在人们的生活中逐渐丰富起来,人们对个人隐私也是更加的注重。然而,目前面向隐私保护程度与服务的可用性之间还存在鸿沟,因此本文展开针对CPIR算法和云平台的相关研究,提出了基于Spark的隐私查询保护的相关算法并对其进行了优化。针对传统的CPIR隐私查询保护算法需要对整个数据空间进行扫描,因计算量大而不适用于大规模数据的隐私保护的问题,本文提出了基于Spark并行计算框架的分组范围查询隐私保护、PCPIR-V最近邻隐私查询和PCPIR-V缓存优化查询三种算法。(1)范围隐私查询算法将查询范围的网格划分到不同的分组从而减小了计算量,在此基础上基于Spark对分组进行并行计算,提高了范围查询的效率;实验显示基于分组的范围隐私查询算法相对于朴素的范围查询算法在客户端计算代价、通信代价方面均有所降低,在服务端查询时间有了两个数量级的提升;(2)PCPIR-V实现了基于Row和Bit的两种并行策略,针对基于Row的并行策略在网格划分较少的情况下性能降低的问题,进一步提出了基于Bit的并行策略。PCPIR-V针对朴素CPIR-V算法均有很大的提升,实验结果显示PCPIR-V算法比CPIR-V算法服务端查询时间上有了一个数量级的提升,但是在网格划分过少的情况下存在计算分配不均的问题,基于Bit的并行策略相对行的并行策略在网格划分较少的情况有了很大的提高;(3)PCPIR-V缓存优化算法实现了一种计算共享的方法,这种算法首先将数据进行聚类,再将每一类内的数据划分成(共享差,共享基)的二元组,之后首先对二元组中共享基进行CPIR计算,再利用共享基对数据进行计算,从而实现了计算的共享。实验显示,PCPIR-V缓存优化算法相比于PCPIR-V算法有了大致20%的性能提升。尽管PCPIR-V算法提高了 CPIR的性能问题,但由于CPIR需要对整个数据空间进行扫描,而k-匿名隐私保护算法仅对部分数据空间进行扫描,但是需要一个可信的第三方服务器。在海量数据的今天,对所有的数据进行CPIR计算也是不现实的,因此本文将CPIR-V与k-匿名思想相结合,提出了KB-CPIR算法。KB-CPIR算法结合了k匿名的思想,首先使用基于计算和映射的分片策略对时空信息的CPIR矩阵进行分片,之后只对部分分片组成的CPIR矩阵基于Spark进行并行计算。通过对合成数据的对比试验分析得出,在不同数据量规模下,KB-CPIR相对PCPIR-V算法在服务端有了最高5倍的性能提升。
其他文献
自2005年社会主义新农村建设在全国范围内大力推进以来,农村建设问题越来越受到社会各界的关注。随着农村改革的日益深入,传统农村文化逐渐受到现代文明的冲击,新时期农村文化呈现多元化趋势,形成了新的文化需求和特点。整体而言,我国农村文化建设仍落后于物质文明的建设,距离全面小康社会仍有一定差距。2008年,浙江省安吉县提出“中国美丽乡村”计划,迅速在全国得到推广,并在杭州市临安区试点中发现了文化和礼堂活
比色传感具有操作简单、成本低、不需要昂贵的仪器等优点,己被广泛用于环境监控、临床诊断、生物技术、公共安全等领域。酶由于具有高效性、高底物特异性和高选择性等特点被应用于比色传感检测中。与天然酶相比,纳米酶具有相对较高的催化活性,而且还具有成本低、合成可控、催化活性可调节和高稳定性等优点。本文主要研究基于二氧化锰复合纳米材料的模拟酶特性及应用。此外,根据模拟酶特性,建立了比色传感器,研究其对对苯二酚(
学位
学位
无线协作通信系统中,中继节点往往是移动的,移动中继节点的电力保障是一个困难的问题,电池供电的中继节点的续航能力是有限的,当此类中继节点的电能消耗殆尽时,会影响系统的
学位
改革开放以来,随着计算机技术的飞速发展以及互联网应用的大量普及,各个行业都面临着巨大的机遇与挑战,新技术的应用颠覆了传统的管理模式与方法,为公司和企业创造了巨大的价
伴随着管理信息系统MIS(Management Information System)技术的迅猛发展,这给快捷高效的人民法院案件信息管理带来了契机。将MIS技术应用在人民法院日常事务管理中,逐步实现
学位
安倍第二次执政期间,日印关系进入空前的快速发展阶段。日印两国的政治关系持续升级、经济联系日益紧密、安全合作不断深化、社会交流更加频繁,双边关系在多方面多领域快速发展,提升了两国的综合实力和地区影响力。日印合作的层次和领域也更加广泛,制度化合作水平较高,也增加了在跨区域合作方向的关注和投入。同时,在这一时期日印在“印太”地区扩展政治影响力和平衡中国的影响都体现出双边合作显著的地缘政治指向性。日印关系
学位