论文部分内容阅读
随着信息安全事件的频繁出现,用户对医疗信息的访问控制与隐私保护需求越来越迫切。但是,现有医疗信息的安全机制,特别是在分布式环境下的安全机制却非常薄弱。因此,针对医疗信息的访问控制与隐私保护已经成为当前计算机安全领域研究的热点。Airavat是一个基于MapReduce框架的安全模型,它利用强制访问控制和差分隐私保护技术对分布式计算环境下的敏感数据提供很好的访问控制和安全隐私保护。数据提供商可以利用Airavat模型对他们的敏感数据采取多种安全访问控制策略,对潜在的隐私侵犯行为进行有效的防护。Airavat的差分隐私保护是通过添加噪声使数据失真,从而起到保护隐私的目的。对于一个具有严格定义的攻击模型来说,差分隐私保护技术具有添加噪声少,隐私泄露风险低的优点。虽然在相关的理论研究和实际应用中,证明了Airavat模型是可行的。但是,对于如何防止由非敏感属性信息推测出个人真实身份的问题,Airavat模型在利用访问控制技术和差分隐私保护的过程中并没有提出很好的解决方案。而且对通过间接推理获得敏感信息的行为很难预防。因此,本文在Hadoop基础上,设计了医疗信息的访问控制与隐私保护的方案。首先,分析了Map和Reduce阶段之间传输数据时的信息泄露问题,提出了一个Map-Reduce之间数据传输的安全保护策略。其次,针对医疗信息数据结构的特点,对原有的差分隐私保护进行了优化调整,本文设计和实现了一个基于Airavat模型的优化差分隐私保护机制。最后,本文通过对医疗信息数据进行独立化设计减少信息之间的关联度,从而为利用间接推理获得敏感信息的攻击者增加推理难度,使得推理过程无法进行,实现数据的安全访问控制。通过实验验证了本文设计的各个策略和机制在对医疗数据中的数值数据进行保护的情况下的可行性和有效性。