论文部分内容阅读
随着信息技术的发展,企业在生产中积累了大量的生产数据和经营数据,而这些数据大部分被搁置,没有为企业的生产经营提供有价值的指导。为此,本文利用数据挖掘技术对企业的数据信息进行了分析研究,希望得到隐藏在数据背后的规律,为企业的工艺优化以及生产提供决策支持。
论文主要针对某中药提取企业生产线采集的工艺控制数据以及产品质检数据均为连续数据以及缺失记录较多的特点,对其进行缺失数据的补偿、清除空白记录的处理,以及对生产过程数据和质量结果数据进行了集成和离散化处理,最终得到了适合数据挖掘的数据集。利用k-means和DBSCAN聚类算法进行聚类,分别得到七个质检指标的聚类区间,为企业确定质检指标提供了科学的依据。论文还对Apriori算法进行了改进,在算法中加入了用户兴趣度的概念,控制了候选集指数增长,提高了运行速度。运用该算法发现了生产加工控制信息与产品质量指标之间的影响关系。并在此基础上,建立左侧为生产加工参数属性、右侧为质检指标的关联规则,并将这些规则的左侧属性作为输入,右侧属性作为输出,利用BP算法训练网络模型,得到了质检指标固含量的取值区间,进一步验证了关联规则结果的准确性。
论文最后针对企业数据特点和业务需求设计开发了数据挖掘系统,将对质量检测数据的聚类分析、对生产过程信息及产品质量数据的关联规则、神经网络建模与固含量预测几个常用的分析功能集成在一个系统中,便于企业综合分析和研究生产等有关情况,为企业提高其生产效率减低成本等提供科学的分析辅助工具。数据挖掘