论文部分内容阅读
随着计算机通信技术的快速发展,网络安全问题也变得日益突出,以聚类分析为核心算法的入侵检测技术成为网络信息安全领域的一个重要组成部分。但当处理维度高、结构复杂、数据量庞大的数据集时,一些传统的聚类算法检测结果不理想。为了改善入侵检测系统的检测性能和检测速度,混合聚类算法成为人们研究的热点。 基于以上研究背景,本文主要工作如下: 1.提出一种基于网格和密度的混合聚类算法。针对CLIQUE算法存在的问题,采用最优网格划分方法来代替原有的固定划分方法,大大减少网格单元的数目。同时引入边界优化技术对网格边界进行处理,进一步提高聚类结果的精度。最后采用基于密度的DBSCAN算法对密集空间集合中的对象进行处理,识别出包含在其中的各种形状的聚类。 2.将混合聚类算法应用于入侵检测技术中,使用经典的KDDCup99数据集进行测试和评估。按照混合聚类算法的步骤依次对训练数据集进行预处理、训练和标记工作,然后按照检测算法对测试数据集进行逐条检测,识别出入侵行为。实验结果表明,改进后的算法比原算法具有更高的检测效率,同时检测结果也更加准确,证明了基于网格和密度的混合聚类算法是切实有效的。 3.基于本文提出的混合聚类算法,设计并开发了一个界面友好、功能全面的入侵检测仿真系统。系统主要包括用户管理、初始化、聚类分析和算法仿真四大功能模块。该系统采用Microsoft Visual Studio2008编程工具和SQL Server2000数据库联合开发,并在安装有Windows XP和Windows7系统的多台计算机中完成了功能和稳定性测试。