论文部分内容阅读
网络攻击行为的专业化与复杂化,使得网络安全问题成为一个亟待解决的问题,而入侵检测技术正是解决这一问题的重要手段。虽然已有大量学者做了关于入侵检测技术的研究,但这些研究中或多或少地存在着无法处理海量数据、难以检测变种攻击、漏报率和误报率较高等问题,无法对攻击行为进行有效地检测。为了解决这些问题,设计并实现了一个基于RNN-SVM模型的入侵检测系统。该系统以Hadoop的HDFS文件系统作为数据存储平台,以大数据并行计算框架Spark作为数据预处理平台,以深度学习框架Tensorflow作为模型训练测试平台,有着处理海量数据的能力。通过对入侵检测领域常用的NSL-KDD数据集进行数据清洗、离散特征数值化、特征归一化等数据预处理工作后,使用一种称为属性比例的方法来进行特征选择,可以获得低冗余、低维度的标准数据集。考虑到深度学习强大的特征学习能力,利用深度学习的RNN模型对标准数据集进行特征学习,可以获得刻画攻击行为本质的低维特征,提高对变种攻击的检测能力。同时SVM分类器对低维特征有着良好的分类能力,用它来对降维后的特征进行攻击行为的检测分类,可以降低检测的漏报率和误报率。通过调整RNN模型的各项参数,如神经元数量、批处理大小等,以获得更优的结果。实验结果表明,在对日志数据进行恰当的预处理工作后,基于RNN-SVM模型的入侵检测系统,能够对日志中的攻击行为进行有效地检测分类,特别在二分类上较一些传统模型的检测能力有了明显的提升。