论文部分内容阅读
网络的发展使得各种数据增值业务应运而生,凭借资源站点构建简单和内容类型丰富多彩,对等网络已经占据了网络数据业务较多的带宽。虽然目前网络技术的发展日新月异,网络速度相比以往也有了很大的提高,但是仍然不能保证网络关键业务的服务。对等网络主要应用于多媒体文件的分享和在线点播服务,这些业务占据了网络的大部分带宽,对正常的网络业务开展带来了不良影响。对于P2P流量识别和控制已经成为了互联网运营商十分关注的问题,也成为了当前计算机网络领域研究的热点和难点。
常用的P2P流量识别方法很多,包括扫描和封闭P2P协议所需要的网络端口、对P2P数据流签名进行匹配和屏蔽以及对P2P流量特征进行统计分析等。这些方法对固定时段和应用的P2P流量有一定效果,但是对动态和加密的P2P流量识别较为困难,此外,由于受到识别机制的限制,这些方法在应用上缺乏效率和准确性。支持向量机是机器学习领域进行数据统计和分析的有效工具,其理论基础是统计学习,在小样本空间中具有优秀的运算特性,适合解决运算量大和特征维数高的机器学习问题。经过多年的发展和创新,SVM对P2P网络流量识别提供了可行的研究思路和解决方案。
本文以SVM特征选择算法为研究重点,以对等网络流量识别为研究对象,深入分析了P2P网络流量的产生、发送、传输、接收和处理过程,应用SVM特征选择算法对其进行流量识别。本文对P2P网络数据包进行抓取和分析,通过选取小波核函数,设计特性选择算法对P2P流量进行DFI检测,构建具有学习能力和识别效果的SVM流量识别模型。实现了集成SVM算法的P2Psniffer软件,通过该软件采集网络数据流,使用特征选择算法对样本进行训练和学习,并研究了不同流量模式下,流量特征的选择和对应的核函数参数配置。
常用的P2P流量识别方法很多,包括扫描和封闭P2P协议所需要的网络端口、对P2P数据流签名进行匹配和屏蔽以及对P2P流量特征进行统计分析等。这些方法对固定时段和应用的P2P流量有一定效果,但是对动态和加密的P2P流量识别较为困难,此外,由于受到识别机制的限制,这些方法在应用上缺乏效率和准确性。支持向量机是机器学习领域进行数据统计和分析的有效工具,其理论基础是统计学习,在小样本空间中具有优秀的运算特性,适合解决运算量大和特征维数高的机器学习问题。经过多年的发展和创新,SVM对P2P网络流量识别提供了可行的研究思路和解决方案。
本文以SVM特征选择算法为研究重点,以对等网络流量识别为研究对象,深入分析了P2P网络流量的产生、发送、传输、接收和处理过程,应用SVM特征选择算法对其进行流量识别。本文对P2P网络数据包进行抓取和分析,通过选取小波核函数,设计特性选择算法对P2P流量进行DFI检测,构建具有学习能力和识别效果的SVM流量识别模型。实现了集成SVM算法的P2Psniffer软件,通过该软件采集网络数据流,使用特征选择算法对样本进行训练和学习,并研究了不同流量模式下,流量特征的选择和对应的核函数参数配置。