论文部分内容阅读
当前Web应用与服务呈爆发式增长,其对应的攻击也日益猖獗,Web安全威胁成为个人和企业无法忽视的安全痛点。WAF作为Web应用的第一道安全防线成为最常用的防护方案。随着机器学习技术的发展和应用落地,基于机器学习的WAF解决了传统基于规则WAF的检测效率低,维护复杂并难以检测新型Web攻击的问题,成为WAF发展的新方向。但是基于机器学习的WAF大多没有进行安全性测评,这无疑是一个重大的安全漏洞。针对此问题本文提出一种通过攻击方式对机器学习类WAF进行安全性评估的方法。本文的主要工作和创新点如下:1.首先总结和介绍了WAF中常用算法所面临的安全威胁及对应的攻击手段,并重点分析了其中的对抗攻击,信息泄露相关攻击和投毒攻击。2.提出一个可扩展的量化评估模型SQSE-Model,该模型首先从保密性,完整性和可用性三个方面对机器学习类WAF常用算法所面临的攻击进行分类,每种攻击作为评估模型中的一个模块,各个模块之间通过数据流相互联系;然后将数据流参数化,给出其计算方式,并提出评估模型中每个攻击模块的量化评估方法;最后得到一组从保密性,完整性和可用性三个方面对目标WAF进行评估的数字化结果。3.提出一种基于注意力机制的URL对抗样本生成算法,解决了文本对抗攻击领域中的对抗样本生成方法不适用于URL这种特殊文本格式的问题,并在SQSE-Model中基于该算法完成WAF完整性评估中对抗攻击的实施。该URL对抗样本生成算法首先通过模型提取攻击得到一个影子模型,根据影子模型中的注意力值推断出模型中对决策贡献度较高的词,然后通过URL中特殊字符的属性将决策高贡献词进行分类,最后按照所设计的策略对样本URL中的每一个键值对的值进行迭代的字符级扰动,直到达到扰动结束条件。4.选取了三个具有代表性的评估对象URLNet,HMM WAF和SVM WAF进行实验。根据每个评估对象的自身特点和环境设置,得到针对该评估对象的攻击路线。由于条件限制,实验实施了针对保密性和完整性的攻击,最后给出量化的计算结果。实验结果表明,所提出的URL对抗样本生成算法是可行并有效的,所提出的评估模型具有良好的适应性,可以给基于机器学习类WAF的安全性测评工作提供一种新的思路。