论文部分内容阅读
随着网络技术的不断发展,各种网络应用的日益丰富,使得人们的生活与互联网的关系变得越来越紧密。新的网络技术在给人们的生活带来便利的同时,也给网络管理造成了新的问题。例如,当前主流网站逐渐开始采用HTTPS协议替代原来的HTTP协议,以加密方式传输网络数据,然而不法分子试图利用HTTPS逃避监管,传播不良信息,甚至通过伪造证书的方式侵犯用户的权益。另外,新型BitTorrent应用传输层采用UDP协议,而当前对于此类BitTorrent流量缺乏有效的识别手段。网络环境的净化、服务质量的提升都建立在对网络流量进行有效监管的基础之上,流量识别作为网络管理的重要一环,也因此受到国内外学者的广泛关注。本文针对以上问题,深入研究了现有的流量识别技术,设计并实现了网络流量识别原型系统,主要的研究内容如下:第一,研究流量识别技术,总结了各种技术的优势和劣势,并采用端口识别技术与DPI技术相结合的流量识别方案,对网络流量进行识别。第二,研究模式匹配算法,并总结了各种算法的性能和适用场景。在识别具体协议时,针对不同协议的实际特点,分别选取高性能的模式匹配算法。第三,分析了各种协议的特征,特别是SSH、HTTPS等加密协议以及传输层采用UDP的BitTorrent协议。在对协议特征进行提取的过程中,主要采用逆向工程的方法。第四,设计并实现了实时网络流量识别原型系统,包括流量采集、通用处理层、流量识别、流量统计和数据存储以及用户界面5个部分。其中,通用处理层的设计对外屏蔽了拆包、分流等具体过程,完成数据包的预处理;流量识别模块采用模块化的思想,并针对各种协议自身特征复杂的问题,专门设计了协议分析器。本文最后对原型系统测试了功能和性能,通过对实验结果进行分析,验证系统能够成功识别多种协议,整个系统具备良好的稳定性和可扩展性。