入侵检测中的数据集生成和使用技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:lienkai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于数据挖掘的入侵检测技术是当前网络安全研究的一个热点。基于数据挖掘的入侵检测系统面临的很重要的问题就是如何生成和使用数据集,即如何生成和使用训练数据集和测试数据集。在基于数据挖掘的入侵检测系统中,其特征模式库是通过对训练数据集进行数据挖掘建立起来的。训练数据集质量的高低直接影响特征模式库的质量,从而影响入侵检测系统的检测效果。准确地评测一个入侵检测系统对使用者和开发者都是很有意义的,它可以提供使用者一个选择入侵检测系统的标准;也可以作为开发者辅助开发和调试的工具。一个良好的测试数据集对于系统评测的影响是不言而喻的。但是由于具体环境和各个开发系统的巨大差异,目前这两个方面的研究都还只是初步性的,没有形成行业规范。网络中的流量数据被分为正常数据和攻击数据两个部分。首先假定一个正常网络中的流量数据是正常数据,对它们进行截获以作为正常数据;然后按照一定的方法模拟攻击行为,生成攻击数据;接着按照一定的比例混合构成混合数据。数据集生成以后再根据具体使用的入侵检测算法确定数据属性项,以转换成格式化的记录数据。按一定的比例和方法选取数据集中适当的数据项作训练数据集,并对其进行优化,去除噪音和非典型数据。优化方法采用的是k-NN的改近算法k-NN for IDS。这样生成的训练数据集可以随时添加新的数据量,易于扩充,并且能较好的接近现实环境。测试数据集的生成基本和训练数据集的生成方法相同,但其数据项可以直接从混合数据中选取而得到。由于具体网络环境等的限制,很多攻击可能很难在具体的网络中实现。分段混合评测根据不同阶段评测的重点采取离线和在线评测数据结合的方法,可以减实际环境对评测的限制。
其他文献
随着数据库技术、人工智能和数理统计等技术的发展与融合,数据挖掘技术应运而生。数据挖掘作为20世纪末刚刚兴起的数据智能分析技术,由于其所具有的广阔应用前景而备受关注,已逐
人脸检测是计算机视觉和模式识别领域中的一个热点问题,其不仅具有广泛的应用背景,也有极大的理论研究价值。一般而言,复杂背景、多人脸和变姿态的人脸检测难度较大,现阶段研
用户获取网络服务时,可通过SLA合同来与网络服务提供商协商服务的QoS.验证SLA合同需要有一个SLA管理和报告的工具.国家863课题:基于抽样测量的分布式SLA监测系统,就是一个研
随着计算机技术的不断发展,新的技术和方法不断的涌现出来。从OO到泛型到模板元编程到产生式编程;从COM到COM+到Web Service;从STL到ACE到BOOST到LOKI到ICE。没有一个不让人感到
随着大量有关时间相关型、主动规则型、动态不确定型等现代实时应用的不断出现,数据库的应用正从传统领域向新的领域扩展,支持现代应用的数据库系统应同时提供正确性、及时性
随着网络技术和电子商务(政务)的迅猛发展, 2层结构(C/S)技术已经无法胜任,N层结构的分布式应用体系应运而生。其中,Sun公司的J2EE在开发性、跨平台性、安全性以及分布式组件
交通信息化建设使得交通系统成为一个多种技术集成、多个系统相互作用的复杂实体,系统数据具有来源广、种类多、信息量大,管理和应用呈现多用户、分布式和网络化的特点,同时数据
网上阅卷系统是一种为提高阅卷自动化、智能化、共享化而提出的应用系统。作为一种工作在分布式模式下的计算机支持的协同工作CSCW(Computer Supported Cooperative Work)系
论文首先针对嵌入式应用多样化的特点分析了对嵌入式操作系统的基本要求,然后阐述了微内核结构的优点并详细分析了设计微内核体系结构时需要解决的主要问题.在详细分析微内核
随着Internet的迅速发展,实时多媒体通信已经成为网络发展的一个趋势和热点.传统的PSTN已经远远不能满足人们对语音、图像以及数据的要求.Internet技术的不断发展以及语音、