论文部分内容阅读
随着移动智能终端在人们日常生活、工作和学习等方面的应用越来越广泛,人们对其安全性的要求也越来越高,目前广泛采用口令、图形、指纹等认证技术进行保护。但由于口令、图形、指纹属于一次性认证,只能确保用户登录时身份的可信性,无法保证使用中用户身份的真实性,导致移动智能终端在使用过程中仍存在被盗用或被冒用的风险。基于行为特征的用户身份认证是一种新型的身份认证技术,能够为用户提供动态的、可持续、无感知的认证,目前已成为研究热点。但是目前研究学者提出的认证方案,主要是以用户行为独立作为分析和认证的前提和基础,没有考虑用户实际行为之间内在的关联性。本文针对移动智能终端使用过程中的身份认证问题,提出了一种基于行为序列的用户身份认证框架,并对用户行为序列模式挖掘、用户行为相似性度量和用户行为模式更新三方面问题进行深入研究。本文主要研究内容和创新点如下:1.提出了基于MSLP-Tree的多支持度条件下序列模式挖掘方法。针对传统序列模式挖掘算法采用单一支持度,忽略用户行为间的差异,从而影响用户行为分析结果准确性的问题,设计一种带有多支持度属性的线性前缀树结构MSLP-Tree,能够保存全部数据信息,便于后续挖掘;以树结构为基础,设计了基于MSLP-Tree的序列模式挖掘算法,基于深度优先原则,递归挖掘全部频繁模式及最大模式。实验结果表明,MSLP-growth算法在挖掘效率和空间消耗上都远远优于MS-GSP算法。2.提出了基于行为公共子序列相似度的行为序列相似性度量方法。针对传统朴素字符串比对等方法比对过程效率低、结果精度差,以及大部分算法不适用于用户行为序列比对的问题,设计了基于公共子序列的序列比对算法,以用户最大模式与原始序列的比对形式,提高比对效率;引入匹配补偿及容忍度机制,降低比对误差;结合行为最大相似度和行为全部相似度综合求解行为序列整体相似度,进一步提高相似度结果精度。通过对用户整体行为之间的相似度计算,评估用户独特性。实验结果表明,利用序列相似度算法对用户行为的识别率可达到95%以上;用户独特性较高。3.提出基于MSLP-Tree的用户行为模式更新方法。针对完全更新效率低、用户模式更新情况复杂等问题,考虑用户行为变化情况,将模式更新问题划分为序列更新、项更新和支持度阈值更新三个子问题,大大简化更新问题;分别设计序列更新、项更新和支持度阈值更新算法,以原始结果作为挖掘前提,只挖掘与更新相关部分,有效减少挖掘过程中不必要的时间开销,同时保证更新后的模式精度。在与MSLP-growth算法的完全更新挖掘对比实验中,更新算法的效率均优于MSLP-growth算法,在小规模更新中优势更加明显。