论文部分内容阅读
网络管理系统的直观性以及处理速度的实时性是人们关心的主要问题,NetFlow技术的提出使得基于“流”的网管系统的实施更加便利。随着一系列知名厂商对NetFlow技术的支持,如何运用NetFlow采集的网络数据分析网络流量、发现网络异常使用,成为网络管理的一个新方向。在这篇论文中,我们详尽介绍了均匀采样、系统采样、自适应随机采样、时间分层分组采样以及阈值采样等采样算法,深刻分析了基于自动推理模型的流簇聚类算法的原理和实现方式,包括一维和多维聚类,此方法能自动把网络流归类成最小的簇(Cluster),即能动态地产生与应用相匹配的流簇。例如,它能揭示百分之几的传输是使用TCP协议来连接某一客户机和一组特定的服务器的,而不是汇报500个小的信息流或者到达80端口的TCP传输数量,或者排名前十的主机。我们还分析和修改了开源工具SoftFlowd、Fprobe、Flowd,并且把它们应用于试验环境的搭建。最后,我们将采样算法和自动聚类算法进行结合,提出了基于采样算法和自动聚类算法的网络流量监控系统模型,并且分析了它的理论性质。结合了采样算法的自动聚类算法能被应用于新的流模型的自动归类问题(比如在流结构未知的情况下对网络蠕虫或点对点应用的归类)。另外,我们还阐述了聚类系统原型的系统设计及其在一些实际网络中的试验应用情况。采样算法和自动聚类算法的结合不仅能直观地给网络管理员提供当前网络使用状况,并且由于采样算法的引进,大大缩短了计算时间,节省了CPU和内存的占有率,为网络实时分析铺平了道路。每种网络的异常使用都有其特殊的流量特征,从频繁发生的网络数据流中发现这些特征,正是网络管理系统的关键所在。以上述算法为出发点,我们提出了一套灵活的流量监测模型,并以某大学校园网为试验床,使用以上我们提出的系统模型对网络流量进行了采集分析。