基于机器学习的E级系统故障预测关键技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:bgydong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学工程应用对高性能计算的需求不断提升,实现E级计算机系统成为各科技强国下一步的科研目标。由于新型使能技术尚未成熟,目前研制E级系统的基本手段仍为处理器集成。物理器件受到当前制备工艺的限制,其可靠性难以保证或提升,然而随着系统规模的进一步扩大,愈发频繁的系统故障将使得系统可靠性面临严峻的考验。主流的回滚恢复容错方法因其备份次数频繁、备份信息多、恢复开销大等不足,无法再适用于未来的E级系统。本文着重从主动容错的角度出发,同时考虑将主动容错方法与传统被动容错方法相结合,以应对在大规模系统设计与实现过程中所存在的可靠墙问题。本文首先构建了结点级层次的自治主动容错模型,接着结合被动容错方法,提出了主被动容错方式相融合的“先主动后被动”双层次容错方案。针对主动容错过程中的故障预测这一关键环节,本文构建了基于机器学习的在线故障预测模型,并分别对其处理流程以及各系统结点的功能模块框架进行了设计。系统状态信息的实时收集与处理是实现有效的故障预测的前提条件。本文设计并实现了结点状态信息的实时采集及定期汇总方法,并配置其自动执行,以支持动态、在线的故障预测过程。通过设计与实现IASF方法,本文对系统结点所收集的日志信息进行预处理,成功消除了其中的大量无用信息。基于时域及空域过滤后的日志信息,本文设计了与系统日志相关的故障特征参数,并定义了其计算方法。系统结点按照窗口滑动的方式动态地生成与结点当前状态相对应的特征参数记录,并将其应用于各结点的故障预测过程中。为简化特征参数记录中繁多的故障特征参数,本文实现了主成分分析及线性判别分析这两种参数降维方法来对故障特征参数进行筛选,从而提取出其中的关键特征。利用由精简后的特征参数记录与系统反馈信息组合形成的训练样本,本文采用ID3与C4.5这两种主流的决策树算法来实现机器学习过程。基于集成学习过程所形成的决策树结构,本文实现了规则生成算法,并得到了最简最一般的故障预测规则。以该规则作为依据,系统结点通过区分正常或异常的结点运行状态以实现故障预测。本文最后对在线故障预测过程的各处理阶段进行了测试与评估。实验结果表明按照本文所提出的配置方式与执行流程,系统能够获得最优的处理效果。
其他文献
目的探讨团队建设在局部解剖教学中的应用及效果。方法选择临床医学专业2010级10个班的学生(475人)为研究对象,随机分为实验组(221人)和对照组(254人),实验组采用团队建设与管理的措
恶性胶质瘤是最常见的中枢神经系统肿瘤,由于其很高的致残、致死和复发率,已成为威胁人类健康的主要疾病之一。该类肿瘤患者即使经过手术、放疗和化疗等系统治疗,预后仍然较
本世纪以来,全球接二连三发生并购事件,可以断定产业整合将达到一个新的历史性高度,以强强联合为主要内容的并购重组在新一轮并购活动中将占据主导地位。在这种背景下,我国多
目的探究前环复位固定结合钉棒系统固定后环治疗不稳定型骨盆骨折的临床疗效。方法选取2017年1月至2019年6月本院收治的不稳定型骨盆骨折患者48例作为研究对象,采用随机数字
目的 以两种不同的方法检测二氢杨梅素(dihydromyricetin,DMY)对端粒酶活性的影响,探讨DMY以端粒酶为药物靶点的抗肿瘤机制的可能性.方法 利用端粒重复序列扩增法(Telomeric rep
人体解剖学是医学生最早接触的一门重要的医学基础课程,其结构复杂,名词术语繁多,教学过程枯燥乏味、难学难记,严重挫伤了教师与学生的积极性、主动性和创造性,甚至使他们丧失信心
小学阶段有较重的识字任务,识字教学是小学语文教学的重头戏之一.尤其是低年级,许多课时都是围绕识字展开.所以,优化识字教学,打下扎实基础,对中、高年级语文教学,甚至学生的
目的探讨全胸腔镜下肺叶切除术的手术方法、适应症及其安全性。方法应用全胸腔镜肺叶切除术治疗肺部疾病35例,恶性肿瘤患者同期行纵膈及肺门淋巴结清扫。结果 35例患者中1例
《语文课程标准》在课程目标中提出了要扩大阅读面的要求,“养成读书看报的习惯,收藏并与同学交流图书资料”“利用图书馆、网络等信息渠道尝试进行探究性阅读,扩展自己的阅读面
目的探索糖尿病教育在糖尿病足进展中的作用。方法 80例病人随机分为试验组和对照组,每组40例。试验组进行系统的糖尿病知识学习、考试,跟踪其血糖、重要生化指标及血常规等,