论文部分内容阅读
智能电表除了具备传统电能表基本用电量的计量功能外,还具有双向多种费率计量、用户端控制、双向数据通信、防窃等智能化功能,其元器件构成复杂且故障类型多样,大部分检修人员不具有维修全部类型故障的能力,因而,在智能电表发生故障时准确预测电表故障类型,指导运维人员调度,将会有效降低电网运维人力、资源成本。本文对智能电表故障类型的预测技术展开了研究,主要工作如下:首先,分析了智能电表各个属性与故障类型之间的关联关系。根据近几年采集的智能电表故障数据,利用直方图、占比求和图等直观呈现方式对故障数据分布情况展开了深入分析,梳理了智能电表发生故障可能的原因,同时,为数据预处理方法提供了依据。其次,对智能电表数据中的分类属性和连续属性设计了对应的预处理方法。基于分类属性中类别数量众多的特点,提出了一种基于分层聚类的属性类别聚类方法,合并故障类型分布相似的属性类别,降低数据维度,并对其进行了二元化处理;针对连续数据缺失值比较多的问题,采用了基于属性分布函数的数据补全方法;然后,利用预处理之后矩阵的稀疏特性对其进行了压缩处理。再次,对智能电表故障预测技术展开了研究。首先,设计了可以提取故障数据深度属性的深度神经网络结构,并研究了模型优化和参数调试方法,构建了最优模型;其次,为了解决智能电表故障预测多分类不平衡问题,设计了代价敏感的多分类XGBoost模型,并分析了相关参数调试方法,在测试数据上验证了模型效果。最后,针对故障数据属性存在较大冗余度的特点,提出了一种基于加权列抽样的XGBoost故障预测方法。分析可知,在训练模型时加入冗余属性,不仅会增加训练时间而且还会影响模型准确率,因此,在构造每棵决策树进行列抽样时,使每个属性被抽到的概率正比于其属性重要度,有效提高了集成算法在训练属性冗余度较大数据时的效率,且该方法具有一定的普适性,适用于其他使用列抽样的集成方法中,在电表故障数据上证实了方法的有效性。