论文部分内容阅读
针对汽车零部件质检数据存在合格品与不合格品数量不平衡的问题,提出了基于密度聚类与多工序制造特征的MCDC-MF-SMOTE质检数据过采样方法.先对少数类(不合格)与多数类(合格)样本分别进行密度聚类,再对多工序制造数据和类簇样本分布进行过采样权重计算;根据设定的过采样比和类簇权重,在少数类簇中进行过采样数据生成.使用MCDC-MF-SMOTE过采样方法生成汽车零部件质检的平衡数据集,并采用随机森林排序制造特征的重要性,对分类模型LightGBM、XGBoost、SVM和MNB进行Stacking集成来预测不合格品.与随机抽检相比,该方法对不合格产品的检出率提高了约63%.