论文部分内容阅读
近些年,工业大数据已经在企业产业链的各个环节中得到广泛应用,而工业大数据挖掘是一种用于分析数据之间的关联关系的技术。目前冷轧带钢表面缺陷数据处理方法主要是通过视觉识别后,提取缺陷特征进行缺陷分类进而推送给决策者,对于直接挖掘缺陷与缺陷、缺陷与原因以及原因与原因之间的关联规则研究几乎没有。现阶段企业的处理缺陷数据的方法一般是采用人为分析,该方式不仅效率低下,且分析结果不准确易出错。针对这一问题,本文将工业大数据挖掘技术应用在冷轧带钢表面缺陷数据关联关系分析上,建立冷轧带钢表面缺陷数据关联规则挖掘模型并采用Visual C++设计出相关系统。 本文主要研究工作如下: (1)本文讲述了目前工业大数据的应用领域并对此做了深入的分析,针对工业生产中产品缺陷数据不能有效利用这一实际问题,本文首先建立基于历史统计数据以及基于专家经验数据模型为缺陷数据关联规则挖掘算法提供理论支撑,然后对钢铁生产工艺信息源进行分析,得到适用于钢铁产品表面缺陷数据挖掘的理论模型。 (2)目前已有的模糊频繁项挖掘算法大多是对经典Apriori算法的改进,此类算法存在多次扫描数据集的固有缺陷,且不能解决复杂的工业产品缺陷数据挖掘问题,因此本文针对这一问题提出了面向冷轧带钢表面缺陷数据的加权模糊层次关联规则挖掘算法。 (3)针对冷轧带钢表面缺陷数据经过数据挖掘后的关联规则存在不能有效组织的问题,提出一种基于项目属性差异的产品缺陷数据关联规则模糊分类方法。通过建立模糊分类树计算规则间距离,并对其进行聚类分析,将相似性较大的关联规则划分为了一类,便于决策者分析数据挖掘后的结果。 (4)结合已研究出的关联规则挖掘算法以及关联规则分类算法,设计出适用于冷轧带钢表面缺陷数据关联规则挖掘系统。该系统主要分为六大模块:用户权限、数据导入、在线评估、关联规则挖掘、关联规则分类、结果可视化。