论文部分内容阅读
随着电商、网络视频、网络办公、智能手机等互联网活动及其信息终端产品普及以来,网络流量日益增大,这给网络管理提出了很多挑战性问题,比如网络服务质量问题、网络安全问题、网络带宽问题以及网络非法信息传播问题等。网络流量分类是解决这些问题的一种重要技术手段。1)针对在线非加密流量分类匹配效率不高、识别粒度不够细以及识别协议不够全的问题,研究了几种典型的模式匹配算法,得出AC多模匹配算法高效的匹配性能后,选取支持AC算法的nDPI开源深度包检测库,设计了一个深度包检测(Deep Packet Inspection,DPI)在线流量分类系统。并通过大量抓包实验研究,对nDPI特征库进行了协议扩充,最后对DPI流量分类系统中的各个模块进行了详细设计。实验结果表明,本文实现了细粒度更全面的在线非加密流量分类。2)为提高对多媒体应用的服务质量保证能力,研究了基于Linux系统的在线流量控制机制。通过将DPI识别出的多媒体流量优先级进行提升,同时将下载流量的优先级进行降低的方式,实现DPI在线流量分类方法在流量控制中的应用。结果显示,在15Mbps的有限带宽下,下载文件同时进行高清视频观看,能够缓解视频播放中的卡顿现象,达到了预期目标。3)为了解决只有少量的带标签样本可用时,传统监督分类模型分类准确率低的问题,研究了基于深度流检测(Deep Flow Inspection,DFI)且结合半监督分类技术的加密流量分类方法,设计了一个半监督加密流量分类模型。通过深入分析原有方法的不足,做出了两点改进:一是对传统模型中的聚类过程作了改进,采用BIRCH聚类代替原有的聚类算法,使得模型的训练时间缩短到1秒以下;二是对原有的聚簇类别映射过程中的“简单多数”类别映射原则进行改进,使得模型的分类准确率相比原方法更高。上述改进效果在大量的实验中均得到了验证,提高了加密流量分类的高效性和准确性。