网络流量识别特征码自动提取系统的研究与实现

来源 :北京邮电大学 | 被引量 : 11次 | 上传用户:yuanxu52051
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络流量识别的目标是希望侦测目标网络的数据流,通过对数据流的分析发现该数据流使用的协议类型。当前的时代是信息技术的时代,信息技术的发展是人类历史上一次巨大的进步,尤其是网络的应用已经深入到生活的每个角落,越来越多的人的生活已经离不开网络了。若想有效地利用网络,对网络的使用必须注意考虑到各种问题,例如在架设网络时进行合理的规划部署,提前对网络使用中可能出现的问题采取措施进行预防,在网络部署完成后要把握网络的使用情况,对出现的问题要及时地进行排查,这些都涉及到网络流量识别技术。另外,随着网络的发展,它能提供的服务也越来越多,一些服务是需要计费的,而随着服务种类的增多,分业务计费正逐渐变成一种迫切的需求,网络流量识别技术能够帮助达到这个目的。而且,使用网络的人群数量逐渐增大,肯定会有很多危害社会安全和网络安全的因素存在,像恶意病毒、反动和色情内容等,要阻止这些内容的传播,更要进行网络流量的识别。因此,网络流量识别技术具有很重要的研究价值。目前,常见的网络流量识别技术有基于端口的识别技术、基于负载的识别技术和基于测度的识别技术。其中基于负载的识别技术具有较高的识别准确率,因而应用比较广泛。基于负载的识别技术实现的一个重要前提是获得协议的特征码,使用特征码来进行模式匹配,以此来确定网络流量,设计一套特征码提取系统对于实现基于负载的识别技术具有重要意义。以往的特征码提取工作大多是通过人工实现的,进行提取时的工作量很大。本文提出了一种基于GSP改进算法的特征码自动提取系统,给出了系统的设计方案和实现,并使用几种协议对系统进行了测试。本文首先介绍了网络流量识别技术的研究背景和目前常见的几种网络流量识别技术,并且重点对比说明基于负载的识别技术的优越性。而特征码提取作为基于负载识别技术的首要工作,是本文的主要研究内容和方向。之后,介绍了几种常见的协议识别方法:基于端口的识别技术、基于测度的识别技术和基于负载的识别技术,说明了各个方法的实现原理和特点,并对其准确性和识别效率做了分析比较,说明了基于负载的识别技术的优点和特征码提取技术对基于负载的识别技术实现的重要性。对常见的几种协议应用做了介绍,主要包括HTTP协议、SMTP协议、POP3协议和FTP协议。介绍这些协议的目的是为了明白协议工作的原理和典型的网络流量交互的流程,对它们的特征码有一个初步的了解。随后介绍了改进的GSP算法和涉及到的序列模式挖掘技术。主要是对GSP算法的基本概念、核心思想等做了说明,并对改进的GSP算法做了说明,提出了改进后算法的实现。给出了基于改进后算法的特征码自动提取系统的设计,介绍了系统的框架结构、各模块的设计实现和对数据的处理流程。并对HTTP协议、SMTP协议、POP3协议和FTP协议的特征码提取进行了测试,给出了测试结果和该系统的性能分析。
其他文献
多输入/多输出(Multiple-Input-Multiple-Output, MIMO)系统是未来宽带无线通信的关键技术,是充分利用空间资源以提高频谱效率的一个重要手段。MIMO系统的一个主要优点就是信
无线资源管理对于保障无线通信网络中用户的服务质量起着至关重要的作用。其目标是在有限资源的条件下,为网络用户终端提供业务质量保障。本文首先对小区接入选择算法进行了
无线传感器网络(Wireless Sensor Networks, WSNs)是由大量低成本、低功耗的传感器节点构成。传感器节点具有计算、感知和通信能力,能够协作地实时监测和采集各种环境或监测
X射线脉冲星导航(X-ray Pulsar-based Navigation, XPNAV)是近几年空间导航领域研究的热点,可为近地轨道、深空及星际空间飞行的航天器提供位置、速度、姿态和时间等全面的导
多输入多输出(MIMO)技术利用多个天线实现多发多收,在不增加频谱资源和天线发送功率的条件下,有效改善通信系统的容量和频谱效率。跨层设计充分利用网络各层的相关性,根据无线网络
随着航天技术的发展,传统的测控技术已经暴露出其弊端,如多址能力差、容易被截获和干扰等。而扩频通信具有抵抗干扰能力强、保密性能高、多址能力好、测距精度高等优点,因而
长期演进(Long Term Evolution, LTE)是时下最主流的移动通信技术之一,采用多输入多输出(Multiple In Multiple Out, MIMO)和正交频分复用(Orthogonal Frequency Division Mu
图像配准是指对同一场景下得到的两幅或者多幅图像进行匹配的过程,其实质是一个多参数优化问题。目前图像配准在医学诊断、模式识别、自动导航、计算机视觉等领域得到了越来越
P2P流媒体技术有效地解决了传统流媒体服务的“单点故障”和“性能瓶颈”等问题,是当前产业界和学术界关注的热点。近年来,诸多P2P流媒体系统均已在互联网上实现大规模部署和