论文部分内容阅读
石油是我国重要的经济支柱之一,石油产品的生产工艺复杂,并且对生产设备的控制和生产环境的管理有着严格的要求。近年来,随着人工智能技术在工业生产中的应用以及大数据分析技术的快速发展,基于机器学习的工业故障诊断以及产品质量预测成为研究热点之一。根据实际的工业场景,选取合适的智能算法及模型是研究的重点问题之一。工业生产采集的数据量大,特征维度高,并且包含大量的噪声,因此需要对数据进行预处理以及特征工程,高效的特征工程能够帮助模型取得更高的性能和更准确的结果。目前机器学习在众多领域都取得了很好的研究成果,但是深度学习在一些场景中取得了更好的表现。本文针对石油生产过程,对生产过程故障诊断和产品质量预测进行了分析和研究。(1)生产过程的故障诊断石油生产工艺流程复杂,生产设备数量庞大、种类繁多。一旦出现设备故障,不仅影响油品的生产质量,甚至还会导致安全事故,因此及时发现故障是至关重要的。本文结合石油生产的历史数据进行分析,发现历史数据集中存在数据不平衡的问题,故障案例的种类和数量都是有限的,不能为分类模型的训练提供充足的样本,进而影响模型的准确性。随机森林、支持向量机等智能算法目前已经用于工业生产的故障诊断中,为了解决高特征维度、数据不均衡情况下的故障诊断问题,本文在支持向量机分类模型的基础上,提出了基于随机森林和单分类支持向量机的故障诊断模型,模型能够在数据不平衡的情况下,获得较高的故障诊断准确率。(2)石油产品质量预测石油质量检测对检测设备和检测技术有着很高的要求,并且检测周期长,不能及时反馈质量结果。因此结合生产设备及环境参数对石油产品质量进行预测,可以节约大量的检测成本,并且更快速的反馈检测结果。根据质量反馈可以判断生产状态,以便及时对设备参数和生产工艺进行调整。目前偏最小二乘法应用于石油产品质量预测,偏最小二乘法是主成分分析、相关性最大化和多元线性回归的组合。本文对偏最小二乘法进行改进,提出了基于核主成分分析和循环神经网络的石油产品质量预测回归模型,能更好的拟合石油产品质量预测的输入和输出的非线性关系。主成分分析依据特征包含的信息量选择特征,进而降低特征空间的维度,能够节约模型训练时间和空间的消耗,并且提升模型对特征信息理解的准确性。核主成分分析能更好的用于复杂的非线性特征选择。神经网络能够实现复杂的非线性映射,在特征维度较高的情况下具有很强的拟合能力。通过模型之间的对比分析和验证,证明本文提出的KPCA-RNN模型具有较高的准确性和稳定性。