论文部分内容阅读
P2P技术打破传统C/S模式的限制,成为互联网新时代的主流技术之一。越来越多的人们享受着P2P技术带来的便利,而与此同时,新的P2P应用还在不断涌现。然而,伴随着P2P技术的飞速发展,网络带宽被大量消耗、网络资源监管困难以及安全隐患等诸多问题随之出现,如何有效地对P2P流量进行识别与控制已经成为当前研究的热点问题。传统的P2P流量识别方法主要有基于端口的识别方法、深层数据包检测技术、基于流特征的识别技术等。基于神经网络的识别技术是目前较为先进的一种,它利用神经网络自学习、自组织和自适应的特性,可有效解决传统流量识别方法存在的问题。本文通过对各种P2P流量识别技术的分析,提出一种基于神经网络结合流量统计特征的P2P流量识别方法,着重研究了三种可用于P2P流量识别的神经网络,并对每种神经网络的识别效果进行比较。本文主要工作可总结为以下几个方面:①对现有P2P流量识别技术进行详细分析,指出各种传统识别方法的优势与存在的不足,针对各种方法的优缺点,提出一种基于神经网络结合流统计特性的P2P流量识别方法。②在对PPLive和PPStream两种主流的P2P流媒体系统进行协议分析的基础上总结P2P流量的统计特征,选择数据包总数、平均数据包长度、TCP流量占总流量的比例、上行流量占总流量的比例以及连接数与不同IP数目的比值五种流量特征作为特征向量。③深入研究BP神经网络、LVQ神经网络和FUZZY ARTMAP神经网络三种可用于P2P流量识别的神经网络,详细分析了三种神经网络的网络结构、原理、学习算法及优缺点。④建立了利用神经网络识别P2P流量的仿真系统,选取四种有代表性的P2P流量(BitTorrent、eMule、PPLive、PPStream)和非P2P流量,提取流量样本分别对三种神经网络进行实验验证。结合神经网络特性,从识别率、实时性等方面进行比较,最后选择一种最优方案,并通过调整参数优化神经网络识别效果。实验结果表明,利用FUZZY ARTMAP神经网络识别P2P流量为最佳选择方案。通过对该神经网络进一步优化, P2P流量的识别准确率均可达到94%以上,比未调整之前提高0.66%~4%,神经网络训练时间最长不超过两秒,满足实时性要求。