论文部分内容阅读
当今社会信息安全变得越来越重要,而网络的开放性使其容易受到外界的攻击与破坏,信息的安全保密性受到严重影响。入侵检测作为计算机及计算机网络安全领域的一个十分重要的研究课题,其技术是对其他信息安全技术的一个重要补充。 入侵检测所研究的核心是分类问题,即将一个事件归类为正常或异常的问题。目前分类技术主要有粗糙集理论、神经网络、统计方法、朴素贝叶斯、支持向量机和决策树等。决策树由于具有无参性、构造速度快、高度可解释性等优点而成为数据挖掘领域广泛使用的模型,然而它也有其缺点:所建树可能是局部最优的;测试和选择分裂属性时未考虑属性间的相关性;忽视了预测精度与规则规模的平衡等。 本文针对ID3和C4.5算法进行了深入的分析,对其存在问题展开了讨论,提出了决策树应注重分类精度与规则规模平衡问题这一观点并设计了决策树的一种优化方法。该方法采用遗传算法进行属性组合寻优,实验表明,在不过多损失分类精度的前提下,所构建的决策树规则规模显著减少,因此具有更强的实用性。 最后本文在所提出的决策树优化方法的基础上,设计并实现了一个误用型入侵检测原型系统,该系统实现了如下功能:决策树寻优;对寻优得到的决策树进行测试评估;依据测试评估的结果构建入侵检测分类器。