【摘 要】
:
随着电信网络的飞速发展和网络规模的扩大,人们对电信网络的稳定运行提出了非常高的要求。面对这种情况,电信网络运维人员必须要精准找到产生故障的根本原因并快速解决故障。虽然网络中的故障是以告警的形式呈现,但是由于网络中的设备与组件存在关联,一个设备产生故障会导致相关联的组件或设备也产生故障,从而引发告警风暴,增加了找到故障根源的难度。面对海量的告警数据,准确地分析定位告警根源是解决故障的关键所在,对于提
论文部分内容阅读
随着电信网络的飞速发展和网络规模的扩大,人们对电信网络的稳定运行提出了非常高的要求。面对这种情况,电信网络运维人员必须要精准找到产生故障的根本原因并快速解决故障。虽然网络中的故障是以告警的形式呈现,但是由于网络中的设备与组件存在关联,一个设备产生故障会导致相关联的组件或设备也产生故障,从而引发告警风暴,增加了找到故障根源的难度。面对海量的告警数据,准确地分析定位告警根源是解决故障的关键所在,对于提高网络运行的稳定性具有重要意义。本论文将运用数据挖掘的方法挖掘告警之间的关联关系以帮助网络运维人员准确定位根源告警解决故障。本论文主要的研究工作如下:1、电信网络系统产生的告警数据,如果不经处理直接挖掘告警的关联关系的话,那会消耗大量的时间和资源去处理海量的重复且不重要的告警,影响挖掘的质量。因此,需要对告警数据进行预处理,以过滤掉网络中发生频率高、持续时间短的颤动告警,降低对告警关联分析的影响,提高定位故障根源的准确性。2、在电信网络中,网络设备或组件相互关联,当网络中的某些组件产生故障会沿着调用链进行传播。从数据分析的角度建立告警网络拓扑图以分析告警传播规律是进行告警关联分析与根源分析的重要方法。因此,本论文将从告警数据集中学习得到告警贝叶斯网络,并结合Spark计算引擎提高学习速度,同时结合最小生成树算法,提炼出网络拓扑图的主干路径以优化网络拓扑图。3、序列模式挖掘能够找到数据之间潜在的关系,其研究意义巨大,并且该方法在告警关联分析领域内应用广泛。因此,本论文将基于时间序列模式挖掘告警之间的关联关系。针对GSP算法需要多次遍历序列集以及产生大量候选序列模式导致算法运行时间长的不足,本文对GSP算法做出相应的优化,改进后的算法基于字典搜索树的数据结构能有效减少算法的运行时间,但消耗了更多的内存空间。针对Prefix Span算法消耗内存巨大可能会导致内存溢出的缺陷,本文对Prefix Span算法做出相应的优化,改进后的算法基于二元组链表索引树的数据结构能有效减少内存空间地使用,运行时间与未改进的Prefix Span算法相接近。4、基于以上理论和实验结果,设计了告警溯源AIOps系统,详细介绍了系统的模块设计和实现。
其他文献
一对多的通信中,多播相比单播具有时延小和系统吞吐量大的优势。但是,应用传统反馈重传机制实现可靠多播时易引起反馈风暴。喷泉码作为一类纠删码应用于可靠多播中可有效缓解反馈风暴问题。因此研究复杂度低且具有无码率性的喷泉码以及应用于多播协议的途径具有重要意义。本文首先分析和比较现有各类纠删码方法。接着,设计多播传输实验方案,进而对比分析喷泉码和RS码应用于可靠多播时在吞吐率等方面的性能,以作为设计基于喷泉
如何确保数据的安全性是当今社会的研究热点,加密原语被认为是解决该问题的有效方法。然而,加密后的密文面临着数据可用性降低的挑战。传统的可搜索加密方案能够搜索加密后的密文,但是该项技术仅能够对相同公钥加密下的密文进行操作。针对该局限性问题,支持等式测试的加密概念被引入,该机制可以在不解密的情况下对来自相同或者不同公钥加密下的密文进行匹配操作。虽然加密技术可以保证数据的完整性和机密性,但是不能保证数据的
荧光关联谱方法是一项近年来发展很快的实验分析方法,它通过分析微小探测区域(一般小于1μm3)内少量发光粒子由于布朗运动产生的荧光涨落信号,得到粒子扩散系数和溶液浓度等物理参数值,进而获得粒子的结构和状态、所处的微观环境以及微观相互作用等信息。由于测量具有很高的灵敏度、测量时不破坏研究体系的平衡状态以及可以进行实时监测等优点,荧光关联谱技术在化学、医学和生命科学等领域逐渐显现出它广阔的应用前景。本论
太赫兹频段是介于可见光和微波之间的无线波段,具有通信和光学检测两方面的应用潜力,其高达数十GHz的可用带宽能应用于高速通信上。人们日益增长的物质文化需求对无线通信传输速率提出了更高的要求。在此背景下,太赫兹通信已经成为无线通信行业的研究热点。本文设计了一种零中频收发机物理层系统,论文主要涉及以下工作:第一,分析对比了典型的太赫兹变频调制方案。经过对比分析,零中频收发机凭借小体积、低成本等特点,被采
Endostatin (血管内皮抑素) 是一个20 kDa 的蛋白质,能有效阻止肿瘤血管生成,动物模型试验也表明endostatin能有效地抑制小鼠多种移植肿瘤生长,且无任何毒性。但是目前对于endostatin的分子机理,特别是其最基本的理化性质研究还很少。本论文主要针对以下三个方面进行研究。论文的第一部分工作是采用圆二色谱,荧光和核磁共振等物理手段来研究endostatin的酸变性过程。主要成
本文将主要针对如下三类实际的具有代表意义的离散事件动态系统, 从评价和寻优两个环节出发, 分析探讨问题的相关难点, 并给出切实有效的优化算法. 第一, 针对一类制造系统的资源优化问题, 该问题被模型化为具有fork-join结构的排队网络. 通过分析其均值型评价环节的难点, 我们推广了序优化方法, 即从单目标意义到多目标意义, 并由此进一步给出两阶段的DEDS多目标优化算法框架. 然后分析寻优环节
对于推荐系统来说,数据稀疏和用户冷启动问题是重要的挑战之一。面对数据稀疏问题,常见的解决方案是使用跨领域推荐方法,从目标领域之外的其他辅助领域收集数据提升目标领域数据的密度,但假如某些用户在目标领域有着丰富的交互数据,而在辅助领域数据匮乏,这种传统的跨领域推荐方法便不能提升辅助领域数据的密度。针对这个问题,在基于领域间重叠用户场景下,本论文提出了基于多任务学习技术之“十字绣”网络的多领域推荐方法,
本文从复杂性哲学的视角,就国内外对路径依赖概念和思想的有关研究文献进行大量调研的基础上,把路径依赖概念置于复杂性科学运动发展的大背景中进行考察,比较系统地论述了路径依赖概念产生的理论背景和社会经济背景;从科学哲学的角度,对路径依赖和其他复杂性术语:耗散结构、混沌、分岔、突变、模拟退火、复杂适应系统、适切性景观、自组织临界性、自组织进行了初步的辨析。在第三章,对路径依赖进行了案例分析。 在案例分析之
时间序列数据广泛存在于现实生活中,特别是在智能化城市,智能化工业以及大数据信息时代的大趋势下,大量的时间序列数据可以被轻松获取到,而如何将这些时序数据在现实场景中(如城市交通的监管与预测,工业中的数据分析与智能调度)加以有效利用一直是人们关注的重点。本文从城市交通流量和工业水电流量两种不同的时序数据出发,研究如何利用深度学习的方法对这两种时序数据进行有效分析与预测。现有的时间序列预测方法主要还是基
随着多核处理器的广泛应用以及并行编程技术的发展,面向多核处理器的并行实时任务调度与分析逐渐成为实时系统领域的重要研究方向。本文针对并行实时任务分组固定优先级调度(Partitioned Fixed-Priority,P-FP)的可调度性分析问题,基于有向无环图(Directed Acyclic Graph,DAG)任务模型对并行实时任务的抢占式(Preemptive)调度算法、实时锁协议,以及可调