基于深度学习的流量分类与异常检测研究

来源 :天津理工大学 | 被引量 : 0次 | 上传用户:a7395937
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展与广泛普及,异常流量的种类和数量同样与日俱增,异常流量检测作为计算机系统和网络安全领域的重要组成部分,已经成为当今信息时代的研究热点。基于机器学习的流量分类是异常流量检测方法中研究最为广泛的一类,但是如何设计并提取可以实现对流量特征进行准确描述的相关特征集是当前研究中面临的主要问题。相比较于传统的机器学习,深度学习无需人工设计与提取特征集,为流量分类与异常检测发展带来了新的契机。因此,本文基于深度学习对流量分类与异常检测问题展开研究,主要研究工作和创新如下:(1)优化与构建网络流量数据集。在基于机器学习的流量分类与异常检测方法中,数据集是分类模型的训练基础,对于验证分类方法是否有效,数据集的质量起到关键的保障作用。研究发现,当前的公共数据集普遍存在数据冗余、数据类型陈旧和数据分布不平衡等问题。为解决这些问题,本研究对公共数据集进行优化并构建网络流量数据集。首先通过数据清洗、过采样等技术手段对公共数据集进行优化;其次,从流量数据采集、数据标记和数据平衡等方面,系统化地构建了大规模流量分类数据集TJUTC(Tianjin University of Technology Dataset for Traffic Classification)与异常流量数据集TJUTD(Tianjin University of Technology DDo S Dataset)。与现有数据集相比,TJUTC数据集和TJUTD数据集在数据量、流量种类和可拓展性等方面具有较大优势,同时发布部分数据集供研究者使用。在本文提出的方法中,使用公共数据集和构建的新数据集作为分类模型的训练依据。(2)针对基于传统机器学习流量分类方法特征设计与提取复杂的问题,提出了基于Netflow与DNN(Deep Neural Network,深度神经网络)的流量分类方法。该方法使用Netflow记录作为流量分类依据,通过深度神经网络对Netflow数据进行深层次组合特征的挖掘,自构造网络流量特征集,实现特征集的自动设计与提取。首先,利用Netflow记录格式统一并且易于收集的特点,提取基本的网络流量特征;其次,使用深度神经网络对流量特征进行深层次挖掘,通过非线性数学变换构造流量特征集;最后,通过多项实验讨论了DNN结构对于分类效果的影响,确定DNN模型结构。同时在三种分类器对比和两个数据集上开展了实验验证,实验结果证明,相比较于其他机器学习方法,该方法在分类的查全率、查准率和1值上都有显著提高。同时,采集实际的校园网络流量进行分类实验,取得了较好的分类效果,尤其是对P2P流量识别的准确率达到99%,证明了该方法在实际网络管理中同样具有研究价值。(3)为了解决加密流量分类问题中流量特征集难以提取的问题,提出了基于CNN(Convolutional Neural Networks,卷积神经网络)与SAEN(Stacked Autoencoder Networks,栈式自编码网络)的加密流量分类方法,该方法使用了流量统计特征与空间特征相结合的混合特征集构造方法。首先,将原始流量数据转换成尺寸相同的流量图,使用CNN提取流量图的高层次空间特征,但是流量图转换过程中会造成部分流量信息缺失,影响分类效果;其次,使用SAEN对流量统计信息进行降维,提取降维特征作为补充特征组成混合特征集;最后,使用混合特征集对加密流量进行分类。使用该方法在多个数据集上进行实验,结果表明该方法分类的平均查全率高达97%以上。同时在实际的校园网络流量中进行实验,分类的平均查全率超过98%,符合实际应用需要。(4)在研究内容(2)和(3)的基础上,为了提高异常流量检测效率,从两个方面开展工作:一是结合基于统计的异常流量检测方法;二是优化深度学习模型,减少模型的训练与分类时间。基于此,提出了一种新型的基于混合方法的异常流量检测机制HESS(A Hybrid Method of Entropy and SSAE-SVM,HESS)。HESS是一个包括了数据采集、异常流量检测与攻击防御为一体的异常流量检测机制。HESS使用的异常流量检测方法包括了基于信息熵的初检方法和基于SSAE-SVM(Sparse Stacked Auto Encoder-Support Vector Machine)的深度检测方法。在基于信息熵的初检方法中,通过计算小时间尺度下包单元内流量特征的信息熵值,定义置信区间完成对攻击流量的初步检测。尽管该方法具有较高的误报率,但是作为初检方法能够有效的提高异常流量检测速度。在基于SSAE-SVM的深度检测方法中,创新性的将SSAE与SVM相结合,SSAE对流量特征进行有效降维,SVM根据降维特征进行流量分类。实验结果表明,HESS在保持了异常流量检测的高识别率、高准确率和低误报率的基础上,有效的降低了计算复杂度,减少了检测时间,同时能够进行有效的攻击防御,是一个完善的异常流量检测机制。
其他文献
在过去的几十年中,癌症已经成为疾病死因之首,是最重要的公共健康问题之一。为此,科研工作者为发展灵敏的诊断方法和高效的治疗手段付出了巨大努力。相对于蛋白,核酸肿瘤标志物在癌症早期诊断领域展现出了更大的优势,主要是因为核酸具有自扩增,设计灵活以及稳定性好等特点,更容易通过构建通用型检测体系实现多重靶标核酸标志物的高灵敏分析。更重要的是,丰富的核酸扩增策略为高灵敏、高选择性检测核酸表达谱的微小变化提供了
可燃气体的爆炸严重危害着人们的生产和生活。因此,为了抑制爆炸传播,减小爆炸范围,把爆炸的危害程度控制到最小,掌握可燃性气体爆炸的规律、特点和抑爆技术就显得尤为重要。本文对管道内的爆炸进行模拟,然后引入真空仓,研究真空仓在不同真空度条件下的抑爆效果。把自动抑爆技术和真空抑爆技术相结合,自主设计了一套基于Lab VIEW控制系统的新型管道式爆炸检测和真空自动抑爆装置,并详细介绍了实验装置的各部分构成,
近年来,中国的房地产市场如日中天,房价的节节攀升影响着每一个中国老百姓的生活。研究表明,人口流动与房地产市场存在双向因果关系,人口流动扩大了老百姓对房子的需求,正向推动了房价上涨;然而当房价上涨到一定的高位时却对人口流入产生抑制效应,当迁移者预期自己在某个城市无法买房定居时,就会选择不再流入该城市。也就是说,迁移者是以未来视角在看待流动这件事,致力于追求未来不流动,房子即是未来稳定的保障。然而自O
在异族入侵、战乱不断、社会动荡不安的民国时期,中国涌现出了一批著名中学,如北师大附属中学、天津南开中学、湖南明德中学、江苏扬州中学、苏州中学等,为各领域培养了大量的杰出人才,一定程度上缓解了国家对政治、经济、文化等方面建设的人才需求,同时因应而生了诸多著名中学校长,如林砺儒、张伯苓、胡元倓、周厚枢、汪懋祖等,并促进了近代中学教育体制与模式的中国化,进一步推动了民国近代中学教育的转型,在我国中学教育
水和泥沙共同作用塑造水生生态系统的结构和动态,对维持生态系统的多样性和完整性至关重要。然而在气候变化和人类活动的影响下,大多数河、湖的水沙情势已经被改变,这些变化将改变水生生境,增加生理压力,直接威胁到水生生态系统的健康和发展。研究气候和人类活动诱导的水沙变异及其生态效应,探索如何制定合理有效的水生生态系统保护和管理措施,是当前水生态保护面临的关键问题。洞庭湖是国际重要湿地,具有重要的生态价值和资
软件水印是一种用于声明软件著作权的软件保护方法,通过在软件中嵌入水印信息,软件开发者可以对软件的发布进行追踪并鉴别盗版软件。软件水印技术已经成为了学术界和企业研究的热点问题。在现有的软件水印工作中,水印信息与载体程序之间大多不存在逻辑上的关联性,因此攻击者可以在不破坏载体程序正常运行的情况下移除水印代码,继而对软件进行篡改和抄袭,而在现有针对此类问题的工作中,存在实现过程复杂,需要训练大量的机器学
龋齿、牙周炎和外伤等口腔疾病造成了世界性的口腔健康问题。牙周病是口腔常见病和高发病,影响着世界90%的人口,被认为是造成成年人牙齿缺失的主要原因。牙周炎是一种牙齿支持组织的炎症性疾病,主要累及牙龈、牙周膜、牙骨质和牙槽骨,造成牙齿支持组织的丧失,最终导致牙齿甚至牙列缺失。与牙周炎相似,种植体周围炎涉及种植体周围支持组织的损害,导致种植体脱落、种植修复失败,是目前种植修复最常见的并发症。随着种植修复
二维过渡金属硫族化物的二维异质结由于原子尺度的厚度和独特的物理性质,使不同特性的二维材料形成优势互补,丰富了二维材料性能,在下一代电子和光电子领域具有巨大的应用潜力。二维异质结通过连接方式可以分为面内异质结和横向异质结。然而,二维异质结在制备和性能研究等方面还面临着诸多挑战,主要的问题是:如何获得纯净的接近本征二维异质结的材料,通过化学构筑如何精确控制不同成分的晶体成核生长位置,二维异质结构的组成
氨气(NH3)主要来源于农业生产活动、化学工厂以及畜牧业的排放,具有较大的毒性,当氨气浓度为1000 ppm时,会导致肺部积液,水肿,甚至死亡;在化工领域中,液氨容易挥发泄露,达到爆炸极限(15-28 vol.%)会引发生产安全事故;在食品智能包装领域中,蛋白质腐坏后会产生氨气,通过检测氨气浓度即可确定食物的新鲜程度。鉴于氨气的危害与特殊的使用价值,开发针对氨气敏感的各类传感器是当今研究的热点之一
学位