论文部分内容阅读
入侵检测已成为网络应用发展十分必要的主动安全防御技术,一直以来都是一个重要的研究课题。网络技术的多样化发展使入侵检测面临更严峻的挑战,主要问题在于如何保障对海量数据的检测分析速度和精度。因此,将特征选择算法应用于入侵检测,可有效降低检测数据维度,在维持检测精度的条件下大大提高检测效率。
特征选择是指依据给定的评价标准,从原始特征空间中选择一个最优特征子集。但是,目前应用于入侵检测的特征选择方法往往是封装器模型方法,它需要与学习算法之间进行一系列的反复迭代验证特征选择的效果,以选取最优的特征子集,这样势必会造成大量时间花费:另外传统特征选择算法经常轻视冗余特征对数据集的影响,而冗余特征的存在间接加重了检测系统的实时性问题。因此,研究新型快速的特征选择算法对于提高入侵检测系统的检测效率十分必要。
本文首先介绍特征选择算法在数据挖掘和入侵检测中的研究现状,详细分析了特征选择算法的研究,给出了特征选择算法的四大要素和分类模型的阐述;接着,阐述了一种基于数据不一致率的快速特征选择算法及其实验分析效果,并从两个方面进行改进,首先通过对称不确定性值对特征进行分类能力降序排列,降低特征选择时间与计算复杂度;再通过特征对数据的一致性贡献度进一步判定特征的分类能力,并确定特征间的相关性,充分考虑特征间的相关性,消除冗余特征。利用UCI数据集完成了实验测试,对比分析结果表明改进的快速特征选择方法不仅具有较高的分类正确性,且具有明显的计算优势。
最后,为检测本文方法应用于入侵检测数据集中的有效性,本文将所提方法应用于KDD99数据集和DDoS攻击的实测数据集中进行实验,并与多种特征选择方法进行比较。实验结果表明,方法可以快速充分地删除不相关特征和消除冗余特征,减少检测的处理数据和维度空间,降低算法的计算复杂度和运行时间,有效提高入侵检测效率。