论文部分内容阅读
基于高性能计算机应用环境的危险性和复杂性,其互连网络的可靠性与容错性必须得到保证。但是,网络元件的失效或故障往往都具有随机性和不可预测性,这给互连网络可靠性的研究带来了不小的困难。而且,在现有的研究中,仍然有一些问题需要解决,比如评估方法和算法的过于复杂、统一指标体系的缺乏、寻径策略的非容错性等。不过,图论、概率论以及数学建模等方法的应用保证了分析的严密性和逻辑性,实验分析和对比法的应用保证了分析的正确性、结果的实用性。
本文首先对链路失效(结点独立正常)概率模型下STAR网络中仍然存在着非失效子网的可靠性概率进行分析,结果表明STAR网络的可靠度是完全可以控制在0.99以上的。对比试验结果表明在同等规模、网络元件可靠概率一致的网络环境下,只考虑链路失效而假定所有结点完全正确情况下的网络可靠性要比只考虑结点失效而假定所有链路完全正确情况下的网络可靠性要高。接着,本文将贝叶斯网的概率推理用于STAR网络可靠性的评价中,并通过网络的二连通率来对网络可靠性进行分析。结果表明如果失效结点数量在有条件的容错模型内,那么失效结点不同分布情况下的网络二连通率差值可以忽略不计,而且,在现有大规模集成电路技术条件下,失效概率可以严格限制在低于1×10-4级别的概率范围内,因此网络可靠度可以直接用网络二连通率来表示,并以此为标准将网络可靠性控制在一个较高范围内,进而满足网络的不同实际需求。最后,本文还对STAR网络下的容错寻径策略进行了研究,提出了一个具有一定自适应性的容错寻径算法。结果表明,在可控的结点失效概率下,对于大规模的STAR网络,算法仍能够在一定的时间复杂度内以大于99%概率找到几乎所有的并行路径,且包含了所能找到的最短路径。