【摘 要】
:
在我国电信网络设施建设飞速发展、电信网络用户数量激增、网络情况日益复杂的情况下,大量网络故障的发生对国民经济、运营商收益造成了极大的损失。近年来,大数据技术愈发成
论文部分内容阅读
在我国电信网络设施建设飞速发展、电信网络用户数量激增、网络情况日益复杂的情况下,大量网络故障的发生对国民经济、运营商收益造成了极大的损失。近年来,大数据技术愈发成熟,使得利用现有的大量设备日志数据预测网络故障,进而进行快速定位和修复成为可能。然而,网络设备日志数据量大、维度高、结构复杂、难以分辨的特点,却为数据挖掘工作带来极大挑战。为了能够进行进一步的数据挖掘,本文提出并实践了一种新的针对大规模网络设备日志的模式提取方法。论文的主要内容包括:1、总结了现有的日志模式提取方法和不足,以及网络设备日志处理遇到的主要难点。2、设计了一种针对网络设备日志的模式提取方法,并以某省运营商14天的日志数据为例,对日志模式提取方法的效果进行了验证。3、针对模式提取后的冗余问题,应用word2vec的方法对日志模式进行汇总和归并,并应用k-means和轮廓系数的方法对于数据模式化的效果进行了验证。经过一系列模式提取方法的应用后,上亿条网络设备日志被汇聚为八千种日志模式,有效降低了日志数据的维度且提取出有价值的特征,使日志数据可以应用于数据挖掘分析。
其他文献
针对田湾核电站核岛设备冷却水系统(KAA)发生的腐蚀问题,采用电化学方法研究缓蚀剂对铜和不锈钢的腐蚀电化学行为和缓蚀机理.结果表明:甲基苯骈三氮唑(TTA)+磷酸钠复配方案在含有微
子粒硬度是决定小麦市场分类及其最终质量的重要特征之一。根据硬度的不同,可以将小麦分为三个硬度等级:软麦、混合麦、硬麦。不同硬度等级的小麦具有不同的使用价值。Puroin
激光测量技术在现代科学研究与技术应用中扮演重要角色,特别是基于激光光斑位置检测的测量技术,由于具有检测精度高、抗干扰能力强等优点而广泛应用于高精度静态目标位置检测
利用大气颗粒物质量浓度分析仪(TEOM)及大气细粒子快速捕集及其化学成分自动在线分析系统(RCFP-IC)于2008年10~11月在中国科学院华南植物园鼎湖山定位站进行了大气细粒子(PM2.
详细介绍了我国核电厂地震安全评价及抗震分析与设计中用到的多部国内外的法规、标准和导则的技术规定,对其技术背景和要求进行了深入比较和分析,结合工程实践给出了相关的评述
随着新冠肺炎疫情防控进入常态化,本以为可以稍微松口气,不料夏季炎热、睡眠不佳,心血管疾病的患者又增加了不少.本文以2个病例与之讲述. 病例1 患者男性,45岁,外卖人员,既往
病理 肉眼见左肾实质性肿块,包膜完整,其内见轮辐状纤维分隔(图6),镜下示:癌细胞呈圆形或多边形,核周空晕明显,细胞膜厚,核不规则、有异形性,可见“葡萄干”样核(图7)。诊断:左肾嫌色细胞
夏至将至,虽然“不过夏至不热”,但现在已持续高温,医生需要提醒心血管疾病患者不能忽视心脏疾患,尤其是中老年人,更需注意“护心”。为何要“护心”夏天来临、天气炎热,人体