论文部分内容阅读
随着各种新兴应用和网络技术的大量使用,网络环境变得越来越复杂,对网络管理提出了巨大的挑战。如何才能更好地监管网络流量和保障网络服务的QoS,准确高效对网络业务的识别和分类是前提。在基于业务流统计特征的网络业务流识别分类方法中,特征的选取是关键。本文通过对tudou视频、Skype、DOTA、QQ视频、迅雷等5种常用Internet业务进行分析,分析的主要特征有包大小分布及其统计特征、Hellinger距离、包大小平均概率及包大小转移概率、上下行包数目和字节数比例等。经过分析发现:各类业务的包大小分布较为稳定,包大小分布的均值、方差、信息熵、四分位数、峰度参数和偏度参数等统计特征均能一定程度上反映业务流包大小的特征。计算比较业务流之间包大小分布的Hellinger距离发现,tudou视频和迅雷业务包大小分布具有一定的重合,DOTA和Skype两类业务的包大小分布很相似。而这些业务在上下行包数目和字节数之比上也有着明显的区别。因而可以使用包大小、上下行包数目和字节数之比这些特征进行业务流的识别分类。最后,对现有的AP-SVM算法进行改进,提出了一种改变偏向参数(perferences)来实现更好地聚类效果的方法,以期得到更高质量、更具代表性的训练样本集,从而得到更好地分类效果。通过对网络业务流的分类实验比较,改进的算法取得了更好的分类效果。