特征选择算法研究及其在入侵检测中的应用

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:foxdeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
入侵检测已成为网络应用发展十分必要的主动安全防御技术,一直以来都是一个重要的研究课题。网络技术的多样化发展使入侵检测面临更严峻的挑战,主要问题在于如何保障对海量数据的检测分析速度和精度。因此,将特征选择算法应用于入侵检测,可有效降低检测数据维度,在维持检测精度的条件下大大提高检测效率。   特征选择是指依据给定的评价标准,从原始特征空间中选择一个最优特征子集。但是,目前应用于入侵检测的特征选择方法往往是封装器模型方法,它需要与学习算法之间进行一系列的反复迭代验证特征选择的效果,以选取最优的特征子集,这样势必会造成大量时间花费:另外传统特征选择算法经常轻视冗余特征对数据集的影响,而冗余特征的存在间接加重了检测系统的实时性问题。因此,研究新型快速的特征选择算法对于提高入侵检测系统的检测效率十分必要。   本文首先介绍特征选择算法在数据挖掘和入侵检测中的研究现状,详细分析了特征选择算法的研究,给出了特征选择算法的四大要素和分类模型的阐述;接着,阐述了一种基于数据不一致率的快速特征选择算法及其实验分析效果,并从两个方面进行改进,首先通过对称不确定性值对特征进行分类能力降序排列,降低特征选择时间与计算复杂度;再通过特征对数据的一致性贡献度进一步判定特征的分类能力,并确定特征间的相关性,充分考虑特征间的相关性,消除冗余特征。利用UCI数据集完成了实验测试,对比分析结果表明改进的快速特征选择方法不仅具有较高的分类正确性,且具有明显的计算优势。   最后,为检测本文方法应用于入侵检测数据集中的有效性,本文将所提方法应用于KDD99数据集和DDoS攻击的实测数据集中进行实验,并与多种特征选择方法进行比较。实验结果表明,方法可以快速充分地删除不相关特征和消除冗余特征,减少检测的处理数据和维度空间,降低算法的计算复杂度和运行时间,有效提高入侵检测效率。  
其他文献
随着农业数据库的普及和应用领域在不断扩大,建立一系列功能完善、结构体系完整的农业数据库对实现资源的高度共享、促进生产和流通的有序进行,加快成果的研究和转化步伐、创造
蛋白质交互(Protein-Protein Interaction,PPI)是生物医学领域一项重要的研究内容,目前由生物医学进行的PPI实验结果主要以文献的形式存储。PPI信息对生物、医药研究有着重要
关联挖掘是用来发现海量数据集中数据项之间存在潜在的、有价值的关联关系,以便于商业决策提高企业利润。随着移动互联网、人工智能、信息处理、机器学习、物联网等各种计算
随着信息技术的发展,海量数据库迅速增加,对其有效的分析处理技术的缺乏逐渐显现。在此需求的推动下,数据库中知识发现(Knowledge Discovery in Databases,KDD)技术应运而生
基于统计学习理论的支持向量机是一种新型机器学习工具。它具有推广能力强、全局优化、与维数无关等优点,已成功的应用于文本分类、模糊辨识、智能控制、图像处理等领域。  
图像分割是图像处理和计算机视觉学科领域内重点研究课题之一。有效的图像分割为后续工作顺利展开提供依据。近年来,医学图像分割受到国内外研究学者的广泛关注。一类有效的
合成孔径雷达(SAR)是一种主动式的微波成像雷达,由于其全天候、全天时、高分辨率、大面积的特点,成为观测海岸线变化的重要技术手段。目前,已发射了许多高分辨率的雷达卫星,
随着Internet技术的飞速发展,现代化的信息管理对网络化管理的需求日益增加。不少现代化的管理信息系统已经全面开始从桌面应用向网络应用转变,而相应的系统架构也从原来的C/
随着图像匹配技术应用的日益广泛,新的要求也越来越多,图像匹配中一个热点研究问题是如何提高匹配效率,一方面可以简化相似性度量计算,另一方面可以寻找优化匹配搜索过程的算
随着嵌入式技术的不断发展及移动通信技术的不断升级,将嵌入式技术与GPRS移动通信技术相结合应用到供水监控系统中的条件已经逐步成熟,本课题就是采用目前流行的ARM9处理器和