论文部分内容阅读
接入网和互联网应用的很多特性均会受到互联网用户的宏观行为特性的影响,而互联网的发展使得互联网用户的宏观行为特性发生了一系列变化。流量识别是被动网络测量和流量管理的基础性问题,而网络带宽和互联网应用的发展给流量识别问题提出了新的挑战。目前,P2P和即时通信成为互联网2大主流应用,一方面P2P应用的流量已经成为互联网的主要流量,另一方面即时通信已经是具有多种特性的综合化信息平台。本文通过采集真实互联网数据,首先对最为基础的互联网用户的宏观行为特性进行了研究,然后对最为流行的P2P,应用的流量识别和资源流行度问题进行了研究,最后对即时通信应用的特性进行了研究。基于真实网络数据,对互联网用户的用户活动特性和会话特性进行了研究。用户活动特性方面,通过基尼系数定量地评估了用户上网时间和用户流量的不均衡性,分析了用户上下行流量的非对称性和相关性;提出了分别应用gamma分布和Weibull分布对用户上网时间和用户流量建模,通过分析运营商的收益对模型的有效性进行了验证。会话特性方面,发现载波丢失将导致约30%的会话终止;验证了会话到达过程具有短时泊松性;并提出了应用Weibull分布对会话时长建模。上述工作对接入网的设计与收费具有重要指导意义。提出了一种应用于高速网络的基于报文采样的P2P流量识别算法,并在Snort平台上进行了实现。分析了该算法的空间复杂度、误检率和漏检率。通过识别BitTorrent流量,验证了该算法的有效性。针对要求更高处理效率和更低误检率的应用场景,进一步提出了相应的调整方案。提出了一种主动探测BitTorrent Tracker服务器的资源流行度测量方法,并对4个国际BitTorrent tracker服务器的资源流行度进行了测量。通过基尼系数定量地评估了资源共享流行度与资源下载流行度的不均衡性,发现其间具备较强的线性关系。验证了Zipf和Zipf-Mandelbrot模型都适合于资源共享流行度建模,而后者具有较好的建模效果;也验证了Zipf模型不适合于资源下载流行度,进一步提出应用Zipf-Mandelbrot模型建模,其具有完美的建模效果。基于真实网络数据,对MSN应用的用户活动特性、聊天会话特性和消息传播网络特性进行了研究。用户活动方面,验证了在线用户数存在工作日和非工作日模式,并发现绝大多数用户周内只有少数几天具有通信行为。聊天会话方面,发现聊天消息具有短小的特点,聊天会话则以小消息量、短时长和小字符量会话为主;进一步提出分别应用Log-logistic分布和Lognormal分布对聊天消息长度和会话字符量建模,应用Generalized Pareto分布对会话消息量和会话时长建模。消息传播网络方面,发现消息传播网络的度以小数值为主,存在规模超过用户数50%的超级群体和聚集成团的现象;提出分别应用Lognormal分布和Zipf模型对消息传播网络的度和普通群体建模;通过测量验证了消息传播网络不存在无尺度特性,进一步发现了超级群体具有小世界特性。