互联网异常流量动态检测技术研究

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:ejian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络流量异常检测是入侵检测的一种检测手段,它能够对网络中数据流量进行实时的收集、分析和处理,根据获得的网络运行状况及时向网络管理者发出异常警告,其重要性得到了研究者们的关注。在大数据时代,数据具有高速、海量的特点,网络流量异常检测如何处理这些数据,使其面临着巨大的挑战,而聚类分析技术能够能很好的解决这一问题,研究聚类分析技术在异常检测中的应用具有重要的实用价值。本文全面系统的总结了网络异常检测理论,接着详细阐述了聚类分析技术的相关概念,指出了聚类分析技术在网络流量异常检测中的作用,分析比较了聚类分析算法中基于层次、划分、密度的聚类分析方法。在数据处理阶段,提出使用信息熵对源数据进行度量,实现检测前的数据处理。在聚类分析阶段,针对K-means算法K值确定和初始中心点选取问题,提出了基于小类合并动态确定思想和密度-最大距离思想的K-means聚类分析算法。在异常检测阶段,提出基于聚类分析的网络流量异常检测模型,解决处理大数据流量问题。具体的研究内容如下:(1)研究使用信息熵对数据进行度量。根据当网络发生异常时,网络数据所表现出来的规律,对流量数据进行提取与分析。选取源IP地址、目的IP地址、源端口、目的端口数据作为异常检测特征属性,使用信息熵对其量化度量,实现检测阶段前的数据处理过程。(2)提出一种基于小类合并动态确定思想和密度-最大距离思想的K-means算法。在网络异常检测过程中,所用到的K-means聚类算法存在诸多问题;针对此算法在迭代运行之前无法明确聚类数K问题,提出了小类合并动态确定思想,即通过最大聚类个数和小类合并法经过多次迭代确定最优聚类个数K的方法。针对初始聚类中心点选取随机性问题,基于密度和最大距离思想提出一种第一步获取密度最大和密度最小两个初始中心点,经过多次迭代,然后获取距离间隔较大的剩余K-2个中心点的方法。选用实验数据集对优化后的算法进行实验验证。(3)提出一种基于聚类分析的异常检测模型。在数据处理阶段、聚类分析阶段、异常检测阶段分别构建三个模块,根据三个模块搭建异常检测模型,并用训练数据集和模拟攻击数据集对异常检测模型进行实验,实验结果显示,本文中改进的K-means算法较传统K-means在检测率和误报率上都具有明显的优势。
其他文献
随着互联网在规模上的飞速扩展和在应用上的广泛普及,人们的工作和生活已经越来越离不开网络。特别是网络多媒体技术的出现,给人们的工作和生活都带来了许多方便,诸如视频会
随着移动通信与计算机技术的发展,移动智能设备被广泛应用在人们日常生活中,大量的信息被存储在这些设备上,同时由于经常性的交互,这些信息通常存在着多个副本。为了在人们之
虚拟企业是适应市场需求的有效组织模式,它融制造技术、现代信息技术和管理技术于一身,是未来企业合作的理想组织形式。起源于办公自动化领域的工作流技术可以对虚拟企业起到
本文主要对信息抽取中的命名实体识别和模板自动获取两个技术进行了研究,并提出了一套有效的解决方案.在命名实体识别方面本文重点研究了中文人名的识别和机构名的识别.本文
文章首先介绍了PBNM(policy_based network management)的思想及其在园区网络管理中实施的意义,给出了课题的设计目标和任务;然后,对系统进行了总体分析,针对用户的需求和现有的
随着我国国家信息化工程的建设发展,各行各业都建立了各自的信息处理系统,但是,目前企事业等单位现有的软件往往由不同的部门开发,软件之间相互独立,自成系统,数据标准不一致
随着经济的发展及科学技术的进步,各行各业面临的是一个日益复杂和不断变化的环境,决策问题变得越来越复杂,特别是对于面向多层次、多目标的复杂系统决策问题,因涉及到多种专业知
随着Internet技术的发展,计算模式不断更新,信息系统基本架构也从C/S架构逐渐发展为当今主流的B/S架构。各种设计模式的提出与使用对信息系统的开发产生了越来越大影响,模式采用
语音识别技术自诞生以来就对人类的生活方式产生了深远的影响,因此语音识别技术一直以来都是世界各地学者们深入研究的热点。目前语音识别广泛采用动态时间规整(DTW)技术和基
本论文研究的主要内容是基于内容的图像结构表示和分类。作为一个有着广泛应用前景的研究领域,基于内容的图像分类吸引了越来越多的研究人员参与,取得了许多研究成果并开发了