改进的聚类分析算法在入侵检测中的研究

来源 :武汉科技大学 | 被引量 : 3次 | 上传用户:guipian110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
入侵检测技术是一种通过主动检测来发现计算机网络中异常行为的技术,主要方法是采集计算机网络以及系统中的数据信息和系统记录,对这些数据进行分析从而发现异常。近几年关于入侵的研究中,数据挖掘的方法被专家和学者引入进来,并且得到了广泛的使用,特别是k-means算法被用于对网络中采集到的数据信息进行处理,方便而且灵活性强。但在实践应用中,单纯的算法本身存在着明显的缺陷。因此,围绕算法本身来做一些改进是很有必要的,本文的主要工作是研究和改进k-means算法在入侵检测中的应用。首先本文对该算法在实际应用于入侵检测时所遇到的问题进行了剖析,研究后有以下两个方面的发现:第一,网络中的数据集是未知的,可能是球面也可能是其他形状的,而k-means算法本身更适合处理球状或者有固定形态的数据集;第二,k-means算法自身所固有的缺点,如何选取聚类的个数以及确定初始聚类中心的位置都没有较好的理论依据,主要依靠经验值,最终可能得到一个局部的最优聚类。对于入侵检测的结果而言,会使得检测率大大降低。然后本文的工作也是围绕以上两点展开,先解决入侵检测数据集的优化问题,一般来说在入侵检测中异常数据本身与正常数据相比差异较大,即可视为孤立点并预先进行处理,使数据集得到优化,接着利用Davies-Bouldin指数来确定初始聚类中心的位置,使得算法本身避免陷入局部最优。最后选取KDDCup99数据集来模拟网络中的入侵数据和正常数据,进行了一定的实验分析。实验结果显示,本文提出的研究和改进,对于入侵检测的检测率的提升有着显著的改善,并且对于任何未知的数据集,都能有较高的检测率。
其他文献
ERP(Enterprise Resources Planning,企业资源计划)是20世纪90年代发展起来的综合企业管理信息系统。它代表了未来企业管理的发展方向和必然趋势。世界上有很多企业成功实施了
服务质量(QoS)是一个综合指标,用于衡量使用一个服务的满意程度。目前随着随着Internet规模的不断增长和多媒体业务的大量涌现,IP网上出现了大量的实时业务。由于实时业务对网
跟踪调试是定位程序中的错误并修正其错误的过程,是软件开发中必不可少而耗时甚大的环节。 从上层看,操作系统是一个功能的集合,其中跟踪调试环境是为上层应用程序提供的一组
近年来,随着构件化嵌入式操作系统的迅速发展,构件的灵活性、构件运行的性能、构件对资源的利用率等方面的问题变得越来越突出。对此我们在构件化嵌入式操作系统Pcanel的微内核
在数据挖掘和机器学习领域中分类是一项非常重要的基本任务。它能对大量有关数据进行学习和分析,并建立相应问题领域中的分类模型。该技术在科学、通讯、金融等领域均有着广泛
随着科学技术的不断发展,计算机安全问题日益成为人们关注的焦点。各种软件层面的安全机制层出不穷,但是由于系统的复杂性、兼容性等问题,单纯依靠软件不能够做到完全意义上的安
计算机技术的应用越来越广泛,众多的工业生产都采用计算机技术来提高生产效率。在生产领域计算机化的过程中,分选问题是诸多实施较难的应用课题之一。本课题以实现一个能应用
随着互联网上并发用户对流媒体应用需求的不断增加,流媒体技术和应用层组播技术的紧密结合,解决了大规模一对多通信问题,成为当前互联网上一个重要的研究方向。本文基于“中国下
在不同的抽象层次上观察、理解、表示现实世界问题连同其解,并进行分析、综合、推理,是人类问题求解过程的一个明显特征,也是人类问题求解能力的强有力的表现。从一定意义上来说
IB理论通过将数据对象压缩到一个事先定义好的“瓶颈”变量的过程中极大地保持其与另一数据对象的关联性,解决了传统的模式分析方法不能有效解决的问题。随着IB理论在各领域应