论文部分内容阅读
随着互联网技术的进步,P2P这项技术得到了快速的发展;据有关数据表明,互联网中60%-80%的数据流都属于P2P业务,在一些领域中例如学校,P2P数据流占用的带宽已经严重的干扰了正常的教学秩序,所以如何有效的管理P2P数据流已成为迫切的需求和研究的热点。但管理是在正确识别数据流的基础上发展的,本文正是在这种前提下提出的。P2P识别技术从早期的端口号识别,到后来的应用层的签名匹配识别,再到利用P2P流量特征进行识别;这些技术都在不断的发展。在新一代的P2P应用中,由于端口采用了随意端口,所以不能简单的通过端口号来有效地区分数据流,且数据传输过程已经加密,不能随意的进行签名的匹配。识别P2P数据流变得越来越艰难;如何找到一种有效的,准确的识别方法成为迫切的要求。本文分析了P2P的流量特征和节点特征,并结合神经网络的BP识别算法,来对P2P数据流进行识别,并在此基础上做了如下工作:1.分析几种典型的P2P识别方法的工作原理,并对比其在识别过程中的优缺点。2.通过捕获的数据包分析当前国内流行的几款P2P软件(迅雷,电驴,QQ)的通信过程,了解P2P软件的特点,为P2P流量特征分析打好理论基础。3.通过wireshark软件捕获P2P和非P2P一分钟的纯净数据流分析其流量特征和节点特征,并将这些特征作为神经网络的输入参数,结合BP算法进行仿真,验证参数在识别过程中的有效性。4.将这些特征参数应用到snort入侵检测系统中,编写识别P2P的规则;并将规则应用在主机上,捕获数据流。