论文部分内容阅读
电潜泵作为海上石油工业生产的核心设备,长时间工作在高温高压的生产条件下,是故障频发的生产节点。一旦电潜泵出现故障,而导致停工停产,将造成严重的经济损失。进行高效的电潜泵故障诊断,可以帮助生产管理者快速准确地判断故障,减少设备维修的时间,还可以帮助生产者及时发现电潜泵的早期故障,提升维修效果,延缓设备的报废时间,防止一系列的连锁反应,提高整个系统的安全性和持久性。因此,对电潜泵进行故障诊断研究具有很大的实际意义。传统的海上油气水井电潜泵的故障诊断主要依赖人工计算和专家经验。随着电潜泵油井设备的复杂化和信息采集技术的精密化,电潜泵数据信息呈现高维度、非线性等特点。传统的方法无法挖掘出电潜泵故障信息的深层特征,对电潜泵故障预测准确率不高和故障诊断能力下降。如何充分挖掘错综复杂的故障信息所包含的深层特征,成为电潜泵故障诊断面临的主要难题。本文利用海上油气水井电潜泵数据,应用与大数据相关的智能算法,开展对海上油气水井电潜泵数据的预处理,数据分析和故障诊断研究。本文的主要工作如下。1.数据预处理。采集的海上油气水井电潜泵数据都是脏数据,存在较多异常和缺失的问题,因此需要进行数据预处理。首先删除异常、缺失、重复和无关的数据;然后利用线性插值、二次样条插值、三次样条差值和最近邻算法对数据进行插补,并计算各类插值算法数据和变量的欧氏距离,以选择最优的插值算法;最后对数据进行变换。这将为后续实验提供数据支撑。2.数据分析。电潜泵数据只有发生故障点的信息,事先不知道影响电潜泵发生故障的目标变量,因此首先需要通过大量数据探索分析电潜泵数据特征的曲线变化趋势,以初步选取电潜泵发生故障的主要特征。进而利用这些特征结合最大信息系数、特征消除和随机森林算法选取主要特征,以此建立相关数据集。3.故障诊断。运用Kmeans聚类、主成分分析+马氏距离和深度自编码三种算法,利用建立的数据集进行智能故障诊断研究,以提前诊断故障发生时间。这三种诊断算法都有各自的优点,但深度自编码算法在提前诊断电潜泵故障发生时间方面效果更好。