论文部分内容阅读
VoIP是一种在IP网络上传送语音信号,并以此推出相应增值业务的技术。由于它不需要专属网络,允许用户共享带宽资源,因而能在IP网络上廉价地提供语音、视频和数据等服务。随着VoIP技术的普及,出现了大量的非法VoIP应用。它们占用大量的网络资源,影响其它网络应用的正常使用,损害其他用户的利益,增加电信网络营运商的成本。非法的VoIP的应用也会带来一些安全问题,如不法分子利用其散布谣言等。所以,对VoIP流量进行分析和识别,是技术发展的必然要求。对于VoIP流量的识别方法的研究,有助于网络管理员以及电信营运商等了解网络中VoIP的使用情况,从而采取进一步措施对其进行监控。
传统的流量识别方法效率比较低的,而且难以识别端口随机、流量经过加密,或者协议不公开的VoIP应用,所以要找出更有效的算法对其进行识别。本文主要根据网络流量概率统计方面的一些特性,对Skype等VoIP应用软件的流量进行分析。研究了贝叶斯算法在流量分类方面的应用,分析了使用该算法识别VoIP流量的可行性,并提出了一个基于贝叶斯算法的VoIP流量识别算法。该算法主要根据数据包负载长度的统计特性,以及先后到达的数据包之间的相关性对VoIP流量进行识别。另外,算法还提出了对流量进行特征选择概念,挑选出最能分类出网络流量的特征,提高识别的效率。论文还根据该算法设计实现了一个VoIP流量识别系统,并对系统进行了测试。
经过测试,可以证明系统具有较高的性能。首先,系统进行贝叶斯学习所需要的时间是40分钟。另外,系统具有较高的实时性,平均的识别延迟时间大约是28.7秒,其中最快反应大约是14秒,最慢的反应时间37秒。而且系统将VoIP流量准确识别为VoIP流量的分类概率平均值为87.02%,最高值为98.634%,最低值为59.625%。因此,整个系统识别出VoIP流量的准确率比较高。所以,系统能够满足对VoIP流量进行实时识别的要求。