论文部分内容阅读
随着网络安全问题的日益突出,保证系统和网络资源的安全成为越来越重要的问题,入侵检测(Intrusion Detection,简称ID)已成为近年来人们研究的新热点。支持向量机(Support Vector Machine,简称SVM)在解决有限样本、高维输入空间的分类问题中表现出泛化能力强、分类精度高等许多优势。针对ID数据集存在数据及特征冗余,直接对其进行训练,效率及精度较低的特点,提出了基于改进SVM的网络入侵检测算法,并使用KDDCUP1999数据集进行了算法测试。主要研究内容如下:1)递归支持向量机(Recursive Support Vector Machine,简称R-SVM)是从SVM的分类特征中选择使分类器性能最好的一组特征以达到对数据进行降维的目的。针对ID数据集较大的特点,提出了基于R-SVM降维的网络入侵检测算法。实验结果表明:SVM分类算法有较其他分类算法(BP、C4.5、K-近邻和最近邻分类算法)更好的分类性能;与全特征分类模型相比,降维算法大大降低了模型的训练与预测时间;与粗糙集降维算法相比,R-SVM降维算法保证了与全特征下分类模型相近的分类性能。2)流形学习是保证将流形上近距离的点映射到低维空间中的邻近点以期通过发现高维数据集的内蕴特征解决“维数灾难”问题;SVM增量学习方法能使SVM的分类精度在SVM分类模型的应用过程中随着样本集的积累而逐步提高或者保持较好的分类效果;K-means聚类算法可以获得数据的基本概况,在此基础上进行特征提取或分类可以提高模型的效率和精度。针对流形学习算法时间复杂度较高、,且网络入侵数据集较大且不稳定的特点,提出了基于流形和SVM的网络入侵检测算法,并加入了K-means聚类算法和SVM增量学习算法。实验结果表明:与无聚类的情况相比,K-means聚类算法在保证了模型精度的同时,大大降低了模型的训练与预测时间;与R-SVM降维算法相比,流形学习降维算法提高了检测率,降低了检测时间;与无增量学习的情况相比,SVM增量学习算法较好的改善了检测率和误报率。