基于领域知识的电网设备故障缺陷案例分析方法的研究与实现

来源 :北京邮电大学 | 被引量 : 4次 | 上传用户:snow5534
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能技术的不断发展,电网系统也迈入了人工智能阶段。在电网行业中大量的设备故障缺陷信息被以文本的形式记录下来,因此,研究出一套从案例中抽取、分析潜在故障规律的方法,对于生产中预防设备故障,提高电力系统健壮性,具有重要意义。由于电网领域极强的专业性,一般的信息抽取与文本分析方法难以直接使用。因此,如何将电网设备知识进行合理组织,使之能服务于案例分析挖掘;如何结合领域表达的用语特点与结构模式,进行设备故障关联分析和故障级别识别方法的设计;如何结合实际的大数据生产场景,基于分布式框架将功能进行模块化实现,都是本课题研究的关键问题。本文围绕以上问题设计实现了一套电网设备故障缺陷案例的抽取分析流程,并将以上功能集成到基于Spark的电力设备数据分析平台,实现了大规模案例的高效分析。在抽取和分析阶段将信息分为词语型和句子型。在抽取阶段,对词语型信息首先设计构建领域本体知识库,进行设备与故障信息的抽象表示;之后设计案例文本语义槽框架,结合槽填充思想,实现基于本体库的关键词语抽取算法,对句法结构复杂的案例进行有效抽取。对句子型信息,首先进行类别语句的特征分析,基于bag-of-word和线性核支持向量机进行句子的分类抽取。在分析阶段,对词语型信息采用关联规则进行故障关联分析,结合Spark框架对FP-Growth进行算法的分布式实现,在Growth阶段对共享前缀和单枝结构通过拆分重组FP-Tree进行计算优化,并将该算法应用到词语型信息进行故障关联规律挖掘。对句子型信息,针对文本包含大量复合专业词汇的特点,设计了 F-GCNN故障级别划分算法,利用fasttext训练领域词向量,实现对案例文本更准确的表示;构建GCNN网络实现对故障级别的高效准确划分。最后将以上抽取分析功能封装为组件,集成到基于Spark的电力设备数据分析平台。
其他文献
以位于祁连山中段大野口关滩森林站的青海云杉林为研究对象,利用2008年观测期间(6月12日至10月8日)34场降雨的大气降雨量、穿透雨量和树干茎流量观测资料,对青海云杉林的降雨
为满足儿童心理发展的需求,提供优质心理保健服务,东台市妇幼保健院根据县级儿童心理保健门诊现状,为进一步健全高危儿监测网络,规范儿童心理保健工作程序和内容,拓展儿童心
遥感技术可以有效完成复杂时空尺度海量信息的收集处理,其与森林健康研究的交叉、融合大大提高了复杂时空尺度上森林健康研究的表达能力。目前,森林健康遥感研究正处于各学科
<正>《义务教育语文课程标准(2011年版)》(以下简称《课程标准》)对习作教学提出了清晰的总体目标和学段目标,为一线教师指明了方向。但在教学中,有些教师认为教科书里的单元
目的探讨健康与疾病的发展起源学说(DOHaD)营养监测指导在孕妇合理饮食中的应用及对母婴结局的影响.方法将2015年7月至2017年7月在该院行产期保健的108例孕妇作为研究对象,按
介绍中国和世界的服装产业的发展现状和现在女装市场的市场结构。结合以上的介绍和分析,研究服装产业的发展,我国服装产业发展现状,整个女装市场的市场方面分析,最后结合服装
采用单因素试验和正交试验研究了竹材加工剩余物的苯酚液化工艺,并进一步研究了竹材苯酚液化产物-甲醛树脂胶黏剂(BPF)的制备工艺和性能。试验结果表明:竹材苯酚液化过程中,
面对我国人口老龄化进程逐步加快,电视媒体已成为老年人满足精神需求的重要来源,有着义不容辞的社会责任。透过曾为全国老年节目王牌的《夕阳红》,几度停播、调整频道、收视
旨在探究陕西省中小企业创新力对其成长性作用路径与效果,为其企业成长发展提供决策依据。基于创新理论,构建了中小企业创新力及成长性指标体系,以新三板市场上12家陕西企业
研究以香港历史建筑遗产—永利街从"拆除区"转变为"保育区"的坎坷过程为例,以普通历史街区的保育历程为切入点,探究香港独特机制下的文物建筑保育体系及其运行过程,以及社会