快速流分类的相关问题研究

来源 :扬州大学 | 被引量 : 0次 | 上传用户:wqwwvfbgo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着新一代互联网技术在中国的迅速发展,互联网的规模不断扩大,业务类型不断增加。据统计,截至2010年12月底,中国网民规模达到4.57亿人,互联网普及率达34.3%。一方面,网络信息量的膨胀,使得网络流量呈现指数级增长的趋势,加剧了网络拥塞状况的发生,导致网络服务质量急剧下降,影响用户的满意度。另一方面,种类繁多的业务类型不但吞噬着越来越多的网络资源,而且给网络安全带来了巨大的威胁。为了能够更好的掌握网络中流量的行为状况,网络管理者需要对网络流量进行可靠、有效的监测与控制,并对网络所承载的各类业务进行及时、准确的分析。而实现这些的前提和基础是对网络流量进行快速准确的识别和分类。根据网络原理的知识,网络应用的一次交互生成的IP报文都具有相同的五元组(源地址,源端口,目的地址,目的端口,协议),反之,一段时间内具有相同五元组的IP报文一定属于同种应用类型。因此目前分类领域通行的做法是先基于五元组将IP报文聚类成流,然后基于流做分类。与早期基于报文分类相比,流分类大大降低了分类动作的次数;另一方面,流中包含更为丰富的信息。综上所述,本文研究基于流的快速分类技术。显著的分类特征和合适的分类器是影响流分类效果的两个主要因素,本文即从这两个方面展开研究。首先,研究了分类特征的问题,提出了ACK-Len ab和ACK-Len ba特征。其中,ACK-Len ab是指请求方在收到对方第一个ACK响应包之前所发送的数据长度的总和;ACK-Len ba是指响应方在收到对方第一个ACK响应包之前所发送的数据长度的总和。分析和实验表明,这两个特征具有典型性,利用它们做分类,具有良好的分类效果。同时,这两个特征的计算仅用到流中前几个数据包的大小信息,能够在流到达初期就对其进行分类,同时该方法仅需存储前几个包的数据信息,因此大大节约了机器的存储空间,为实现真正在的在线分类提供了新的思路。其次,研究了分类器的问题。直觉上,特征数越少,分类时要做的判定和计算动作就越少。因此,基于特征约简和传统分类方法相结合建立分类器的思想,提出基于粗糙集的快速流分类方法。该方法是首先使用粗糙集算法对数据集进行特征约简,然后在约简的特征集上采用贝叶斯网络建立分类模型。实验表明,粗糙集方法与贝叶斯网络相结合可以达到最佳的分类效果,且在约简后的特征子集上进行分类,分类器在分类速度和分类精确度方面都有了很大的提高。
其他文献
赤潮日益成为危害海洋生态环境和人类生产生活的自然灾害。近年我国沿海地区赤潮频发,规模亦呈增长趋势。监控和预测赤潮爆发并及时采取防治措施,利于保护环境,保证渔业生产
内存数据库是一种针对内存的组织和管理的数据库管理系统,它把整个数据库都存储在内存中,具有比传统磁盘数据库更高的实时响应能力,适合用在通信、网上银行、证券交易等实时性高
在医学图像处理技术中,一直以来都存在着一个十分关键的问题,那就是如何正确地提取出我们关心的解剖组织对象也就是我们感兴趣的目标区域,这也正是如何对医学图像进行准确的
人体行为识别是计算机视觉领域的研究热点和难点,在智能监控、高级人机交互、体育运动分析和基于语义的视频检索等方面有着重要的意义和广阔的应用前景。计算机理解人体动作和
聚类分析是数据挖掘领域最重要的研究热点之一。然而随着技术的进步,聚类分析许多应用领域的数据具有很高的维度,同时受“维度效应”的影响,传统的聚类算法在高维数据上的聚类精
当前,在国家提出物联网发展战略的背景下,越来越多非传统网络吸引了人们的目光。其中,车载自组网(VANET)作为一种新型的无线移动网络渐渐地走入人们的日常生活。本文在深入研
在互联网高速发展的今天,以信息的高度互联,高度精确为目标的语义网已经不是一个新的概念,然而与之相关的研究却仍然显得滞后。在语义网中,信息的多样性和异构性是制约数据集成,信
电力广泛应用于国计民生各个领域当中,是一种重要的优质二次能源。在电力系统发、供、用电的过程中,存在着巨大的电能损耗,其中变压器的损耗约占电力系统线损的50%左右。在当
全高清视频(1080p及以上分辨率的视频)交互式点播需要高带宽高稳定性的网络环境,在目前及可预见的未来,大规模开展全高清视频点播业务时,唯一可以确保点播质量的方案是服务器前置
随着计算机技术和信息处理技术的迅速发展,文字识别作为模式识别和多文种信息处理系统的主要组成部分,在模式识别和图像处理等领域中发挥了不可替代的作用。Android系统是一