论文部分内容阅读
伴随着计算机应用在全球各个领域的普及,网络通信正以其独特的方式快速地改变着人们的学习、工作和日常生活。面对飞速发展的网络技术,必须认识到:一方面,网络技术具有广阔的发展前景;另一方面,各种网络攻击与破坏日趋严重,已经严重威胁着网络通信的正常运行。网络安全问题已经成为当今世界全球范围内的重要议题之一,如何高效地检测网络数据识别非法行为,对于维持系统和网络资源的安全性而言尤为重要。传统静态安全防御技术(例如:防火墙技术、数据加密技术等)能够解决系统安全方面的部分问题,但是对复杂多变、日新月异的网络攻击手段缺乏检测的主动性。因此,摒弃被动激发,能够主动检测的入侵检测技术应运而生。作为一种新型安全保障技术,入侵检测技术在入侵攻击行为危害到系统/网络的信息资源安全之前采取积极防御措施。因此,入侵检测系统已经成为网络信息安全方面的重要研究领域之一。但系统和网络数据的海量性和未知性是入侵检测进一步发展的一大挑战。能够从海量数据中提取有效信息的数据挖掘技术有效地解决了这一难题。其中,数据挖掘技术中的聚类分析方法的引入,增强了入侵检测系统在未标记数据集上建立检测模型从而发现异常数据的能力,对于提高检测系统的性能有重大的研究意义。本文以数据挖掘技术在入侵检测系统中的应用为相关理论基础,以聚类分析在入侵检测中的应用为核心,提出针对K-means聚类算法的改进算法。具体工作如下:首先,将数据独立程度概念引入实验数据子集构造理论中,利用独立程度评价属性的重要性,精简数据维数。然后,从传统K-means聚类算法出发,提出基于点密度的初始聚类方式,将数据集合并为若干初始类,结合最小支撑树聚类算法与传统K-means聚类算法实现分裂,从而克服了传统K-means聚类算法聚类初始中心选择难和K值确定的问题。最后,使用KDD Cup99数据集对改进算法在入侵检测中的应用进行仿真实验,结果表明:改进算法在检测率和误报率方面均优于传统K-means算法,有效地提高了入侵检测的检测性能。