面向网络入侵检测的数据样本综合处理方法

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:wangpin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
入侵检测作为一个十分有效且重要的主动安全防御技术,长久以来一直是学者热点研究的前沿课题。训练数据的组成和优劣直接决定了分类模型的有效性、精确度和可伸缩性,从而影响整个入侵检测系统的性能。通过检测网络获得的训练数据具有海量、不平衡、噪音大等特点,给入侵检测系统的实时性和准确性带来了一定挑战。因此,构造入侵检测分类模型前,高效的样本综合预处理十分必要。网络环境的特殊性对预处理提出了特殊的要求。网络样本的不断产生使得已知分布率无法直接应用于数据挖掘的不平衡处理;样本数量过大给压缩处理本身带来了麻烦,此外样本内的类别不平衡极大地影响了压缩处理的准确率。由此针对网络数据的预处理必须采取结合处理。本文将从两个方面对样本进行预处理:(1)利用与分布率不相关的K-S统计分割数据集,降低每个数据子集的不平衡程度,减少类别不平衡对分类规则的影响。实验结果表明该方法能够提高不平衡数据分类问题的准确性和效率。(2)改进Affinity Propagation聚类算法,与簇中心距离较近的样本采取直接关联的方法,减少聚类样本数量,降低时空消耗。并依据关联结果,不断调整模型,精确聚类结果。实验表明该方法能够有效地降低聚类算法的时空代价,同时保持较好的数据压缩结果。最后结合不平衡数据处理及样本数据压缩方法,设计独立于分类学习的预处理算法,构建一个轻量级网络安全入侵检测模型。为检验该模型的有效性,使用KDD99数据集进行实验,并采用不同分类方法学习,以测试模型的适用性。实验结果表明,本文提出的模型在3种分类器下入侵检测时间性能和准确精度都得到了有效提升。且该模型能以较优的时空性能对大数据进行预处理,并可以依据实际需求选择相应分类方法,具有实际可用性。
其他文献
DDoS攻击是互联网安全的重大威胁之一。随着网络破坏者的不断增多和攻击工具的不断改进,攻击防范的需求变得越来越紧迫。问题的严重性引起学术界的研究焦点从静态的防御单体转
在机械产品的设计和制造过程中,零部件的装配是极为重要的一步。传统的机械设计是在制造出物理样机之后再进行反复的试装配,这使得装配成了限制新产品研发速度的瓶径。本文基
在经历了多年大规模的网络建设之后,电信运营商眼下都将精力集中于对现有网络资源的整合、业务模式的创新、服务质量的提高和业务流程的优化等关键环节以期实现快速的投资回
随着Internet规模的日益扩大,各种应用以及网络流量迅猛增长,需要网络设备提供更高的带宽和数据分类处理能力。数据包分类技术对于防火墙、入侵检测、Qos、虚拟专用网、流量
颜色是物体最基础、最直接的特征之一,为人们提供了许多有用的信息。然而颜色信息并不鲁棒,图像颜色受到光照、物体、观察者三者共同作用,同一场景在不同光照下往往呈现出不同的
随着用户数量的增加以及用户数据的累积,存储系统中需要存储和管理的数据也将不断增长,系统中数据的组织和管理显得尤为重要。合理的数据组织可提高存储系统的性能,使存储系
人脸的自动识别是模式识别、图像处理、计算机视觉等领域最富有挑战性的课题之一,可以广泛的应用于新一代的身份验证、罪犯识别、场景监控、无接触人机交互以及可视通信等领域
随着计算机网络技术的高速发展和广泛应用,许多科学计算领域,特别是计算密集型和数据密集型应用领域,对广域网环境下海量数字信息分析处理和协同计算能力的要求也越来越高。
对于小样本、少数据、信息不完全和经验缺乏的不确定性问题的解决,用传统的数学建模方法并不太适合,芦苇产量预测就属于此类问题。灰色系统理论在解决贫信息、不确定性问题方
学位