论文部分内容阅读
目前,建筑能耗占社会总能耗的比例高达30%,其中,暖通空调与制冷(HVAC&R)系统的能耗占比过半。冷水机组作为HVAC&R系统的核心设备,一旦“带病”运行,不仅会导致系统运行效率低下,能源损耗增加,还会导致系统功能缺失,严重的甚至会危及生命财产安全。对冷水机组展开故障诊断研究可以及时发现机组故障,具有重要意义,现已成为能源领域的热门研究方向之一。本文结合ASHRAE RP-1043冷水机组故障模拟实验数据,采用分析论证的方法对冷水机组历史运行监测数据进行研究,发现冷水机组运行监测数据有不平衡、含噪声、非线性、非高斯和特征维度高等问题。针对这些问题,基于XGBoost算法对冷水机组故障诊断展开如下研究:(1)将极限梯度提升(XGBoost)算法用于冷水机组故障诊断任务中,并基于混淆矩阵建立了三级评价体系。基于RP-1043故障仿真数据库建立了22个数据集,与支持向量机(SVM)和人工神经网络(ANN)类算法进行比较,XGBoost算法在样本数量较少(小样本)时平均Kappa值为0.912,在样本数量较大(大样本)时平均Kappa值为0.931,均高于其它算法,证明XGBoost算法是冷水机组故障诊断的有效解决方法。(2)根据XGBoost算法训练模型时决策树分裂原理提出一种特征选择策略,从Data8数据集(Level 1级故障)的64维特征中选择23维对XGBoost诊断模型较为重要的特征。与其它特征选择方案相比,本文提出的方法在相同维度下有最高的正确率,在不影响模型诊断性能的前提下提高了冷水机组故障诊断模型的训练速度。(3)将粒子群(PSO)算法改进,提出多群粒子群(MSPSO)算法并用于优化XGBoost超参数,建立MSPSO-XGBoost复合模型,并将其运用于冷水机组微小故障(Level 1级故障)诊断中。实验结果表明MSPSO-XGBoost复合模型可以将冷水机组故障诊断的正确率提高至99.67%,能降低系统的漏报率和误报率,适用于冷水机组微小故障诊断任务。(4)针对数据不平衡问题,基于合成少数类过采样技术(SMOTE)提出一种基于局部密度过采样(MOLAD)算法,建立MOLAD-XGBoost不平衡数据故障诊断模型。对于数据分布不平衡问题,改进后的MOLAD算法合成的新样本质量更高,MOLAD-XGBoost复合模型相对于SMOTE-XGBoost,将平均F1值从0.9481提高到0.9511,更适用于冷水机组不平衡数据的故障诊断;基于代价敏感学习,提出了敏感权重并进行验证,结果表明设定适当的敏感权重能够在小幅降低分类器准确度的代价下提高对指定故障的召回率,有一定的实用价值。