基于深度学习的跨站脚本攻击检测研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:milan_27
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的兴起,Web应用已经渗透到了我们生活的方方面面。随之而来的的也会出现很多的Web漏洞,其中跨站脚本攻击(XSS)是该应用中常常出现的一种计算机安全漏洞,它通过注入恶意的脚本和链接到正常的网页来窃取用户的敏感数据。如何来检测这些跨站脚本攻击,是Web安全研究的热点。传统的方法中往往需要花费大量的时间和精力来提取这些攻击数据的特征,而且还需要一定的经验相结合才能取得很好的效果。最近几年已经有研究人员提出了使用机器学习的方式来检测,但是在当前的大数据时代,数据量是越来越大,采用这种浅层的学习已经不能满足我们检测效果的要求。于是本文就提出了一种基于深度学习的方法来检测,首先采用了最简单的词袋模型、无监督的Word2vec模型和Glove模型将我们挖掘到的数据转换成词向量,这些词向量将会替代人工的提取特征,这种方式大大节省了人力,接着使用深度学习模型来学习这些词向量的特征来区分出有攻击和正常的数据,最后再通过对比验证了深度学习模型在跨站脚本攻击检测取得了非常好的效果。在本文中,采集网页数据包含了URL,Javascript脚本和HTML标签这三种类别的20多万条的正反实例,然后通过词袋模型、Word2vec模型和Glove模型把这些数据生成三种不同的词向量分别输入到深度学习模型LSTM(长短时记忆网络)、CNN(卷积神经网络)和CNN+LSTM进行训练学习,目的是将我们的数据集分为XSS和non-XSS。通过多次实验选取CNN+LSTM模型合适的超参数,最终依据实验结果统计出这三种模型的召回率和准确率等指标。结果表明本文提出的CNN+LSTM模型不仅比深度学习中常用的LSTM和CNN模型获得的性能好,而且Word2vec模型得到的词向量训练出来的效果要好于其它两种模型,同时相比一般浅层的机器学习能获得更好的性能,最高的准确率为99.87%,误检率低至 0.08%。
其他文献
采用青少年情绪弹性问卷、自我和谐量表对四川三所高校450名大学生进行问卷调查,以考察大学生情绪弹性与自我和谐的相关关系.结果表明:不同性别的大学生在情绪弹性总分和情绪
用塑料薄膜筒袋套袋、药剂等进行了防治方法比较试验,结果表明,不采取任何防治措施的对照根本无正常新竹,96.67%的竹材使用都受到影响;在笋期喷淋乙酰甲胺磷、绿色威雷药剂防治效果
对于猜的病毒性疾病,应以预防为主.通过 干扰素对猜的病毒性疾病进行治疗,是一种较为有效的方法,而且效果非常显著.本文针对干扰素在猜病 毒性疾病治疗中的应用进行了论述.
目的:观察寿胎丸联合黄体酮治疗先兆流产的效果。方法:80例随机分成实验组和对照组各40例。实验组用黄体酮及寿胎丸,对照组用黄体酮及维生素E。结果:治疗后实验组血清β-HCG
<正>1简介奥罗维尔坝位于美国加利福尼亚北部的羽毛河(Feather River)上。土堤高234.7 m,是美国最高的坝。奥罗维尔湖的蓄水量为43亿m~3,是加利福尼亚州的第二大水库,为南至洛
会议
深度学习以及神经网络模型是近年来机器学习及人工智能领域新的研究方向及热点问题。深度学习在图像识别、语音识别应用中已取得了突破性进展,在人脸识别、信息检索等领域也
在命案侦破的过程中,现场痕迹物证可以为案件的侦破起到关键性的作用,过去我国刑侦的技术手段不佳,所以在现场采集痕迹物证时就会造成一定的困难,无法为案件提供有效的帮助。
对2014年高考全国文综卷Ⅰ和卷Ⅱ的政治主观题进行分析总结,不难发现,原因类(为什么)试题在高考的主观题中占据半壁江山(全国卷Ⅰ34分,全国卷Ⅱ26分)。能否解答好这类题型,对
<正> 一、引言酵母在食品工业中具有重要的意义。长期以来酵母就被用作食品发酵剂,由酵母引起的食品腐败问题也很早就引起了人们的注意。虽然人们对许多食品中酵母发酵和腐败
在司法责任制改革背景下,检察办案组织的内涵须进一步明确。其类型依内部组成,可以分为独任检察官与检察官办案组;依紧密程度,可以分为固定办案组织和临时办案组织;依办案类