论文部分内容阅读
IT系统在企业、部门的信息管理中得到了越来越广泛的应用,随着IT应用的扩展,IT网管系统对告警管理的智能化要求越来越迫切。在IT系统中,如果某个节点或节点中的某个网元发生故障,这个故障会波及相邻节点和节点中的其它网元,引发大量的告警。IT系统中充斥着大量的、重复的、无用的告警信息,而少量的、对网络状态影响重大的告警藏匿于这些无用的告警之中。提高IT系统服务质量的关键在于快速、准确地检测到网络中的故障,并对其进行处理。如何从大量的告警中分析出对运维人员有用的告警,帮助运维人员快速、准确的定位故障是IT故障管理面临的主要挑战。现有网管系统的故障管理一般停留在告警的简单处理和简单的规则匹配,这样的运维模式,并不能保证维护和管理的质量,甚至会影响网管系统在实际中的使用。为了解决这个问题,本文提出了一种基于状态模型的告警关联性分析模型,该模型把实体状态间的相互关系作为为规则存入数据库,当推导出某实体处于某个状态时,通过查找规则库,可推导出与其相连的其它实体的状态,通过地推导,可以把发生故障的实体影响到的其它实体以树图的方式呈现出来,这有助运维人员快速地定位故障。本文不仅研究了这种模型,而且设计、实现了其原型系统。该原型系统在IT的告警管理方面取得了显著的效果。最后本文对该模型存在的不足提出了改进建议。