论文部分内容阅读
随着互联网技术的成熟和网络应用服务的快速发展,网络的复杂化逐渐给网络的管理、维护和检测技术带来很大的困难。虽然与之相关的组网与管理技术在不断提高,但是人们在网络控制、管理、分析和设计方面越来越困难,因此非常有必要对网络流量的来源以及特点进行研究。对网络流量的识别分析可以快速有效的帮助企业发现网络流量的来源以及特点,从而为企业对网络的维护和调整提供依据。本文首先介绍了本课题的研究背景以及意义,然后对国内外的研究现状进行了综述,在本文的第二章概要的介绍了典型的流量识别技术,其中包括基于端口的识别技术,基于数据报载荷内容的流量识别技术,基于统计特征的流量识别技术以及基于机器学习的流量识别技术。本文在第三章详细介绍了本系统采用的关联规则挖掘技术,特别是经典的关联规则的挖掘算法Apriori,并对Apriori算法的优缺点给出了分析,根据Apriori算法扫描次数过多、算法计算复杂度太高的缺陷,提出了基于Apriori的改进算法。本文还依次介绍了本系统的需求分析、系统设计以及系统的具体实现,并分析了系统的测试结果,最后总结了本文的工作,并提出了展望。本文的目的是设计一个网络流量识别分析系统,一方面,该系统通过对网络流量进行监控,我们将能够实时的掌握整个网络的运行情况;另一方面,该系统通过统计分析不同阶段的结果,我们可以对网络资源的运营效率、网络的性能以及网络配置的合理性有更全面的了解。本文为某保险公司设计的网络流量识别分析的原型系统选用了.Net+SQLServer2008的开发技术方案,利用C#作为开发语言,采用了基于数据报载荷内容的流量识别技术。本原型系统还使用基于Apriori算法的改进算法对抓取的数据进行了挖掘,提取并分析了数据的特征,有效的帮助企业发现了网络流量的来源以及特点,为该公司的网络维护和调整提供了坚实的理论依据。本系统的测试结果表明,本文实现的网络流量识别分析系统有对网络流量有较高的识别率,可以有效的挖掘网络流量内在的特征,并且具有较强的稳定性和鲁棒性,符合该公司的设计要求。