论文部分内容阅读
随着网络带宽的提高,基于万兆网络的流分类技术发展迅速,但是现有流分类算法不能满足于高速分类、低冲突率的要求,所以对现有的流分类算法技术进行研究分析与改进成为一项必要的工作。目前,基于流的流量测量已成为万兆高速网络流量测量的一个新的研究方向。而对万兆网络中针对流的测量必须快速对到达的数据包进行匹配以确定它属于哪一个流,因此能否对万兆高速网络中的数据流进行准确测量的关键问题是数据包分类算法的优劣。
目前的流量测量中使用的数据包分类的算法有很多种类,每种算法都不可能适用于全部的网络环境,性能存在不同的优、缺点。论文中对多种IP数据流分类算法进行了较为全面的比较,而且对其中可以针对万兆网络环境使用的算法进行了分析,在Hash流分类算法的基础上,设计了一种基于关键字分解的快速流分类Hash算法(D-Hash:Decompose keywords hash)。该算法通过把关键字进行合并成大块数据后再分解成小块数据,使小块数据与预先选定的随机质数向量分别进行异或,然后将各值相乘最后得出Hash值。该算法与IPSX和CRC32、Bob-JenkinsHash流分类算法进行了比较。研究表明,基于关键字分解的D-Hash算法在哈希值的计算速率和值的分布均匀性、冲突率等方面具有较好的性质,该算法分类速度达到44Mpps,完全能够满足万兆高速网络流量测量的需求。
论文中又利用空间换取时间的算法思想,进一步结合哈希桶查找算法把关键字分解哈希算法应用于适合快速流分类流量测量中对特定流、异常流等进行过滤的流匹配算法中,并与现有基于端口号的匹配算法进行比较分析,得出适用于万兆网络流量对限定流分类匹配的结论,并详细的分析了影响算法性能的各种因素,对其结果进行了仿真研究。
最后将关键字分解哈希算法与哈希桶匹配算法集成在万兆网络流量测量系统中,在实际网络环境下进行测试,从正确性、稳定性和分类速率等方面测试了系统的健壮性及算法的可用性。