论文部分内容阅读
造纸行业的废水排放在工业废水排放总量中占较高的比重,对水污染控制有着重要影响。其中,化学需氧量浓度、生化需氧量浓度、微生物浓度、毒性物质浓度等水质参数是反映实时净化效果、实现废水处理过程在线控制与优化管理的关键指标。由于废水处理过程具有强滞后、非平稳、强干扰、工作环境恶劣、反应机理复杂等特性,采用传统的测量方法很难对水质参数进行快速、准确地测量,于是采用数据驱动预测模型代替或辅助仪表实现在线测量是一种更好的选择。本文针对造纸废水处理过程中数据的高维性、非线性、随机性和动态性等复杂特性,基于改进的偏最小二乘(PLS)模型,开展以下研究:1.考虑到并非所有采集到的数据值均为正常值,在构建预测模型前,采取动态并行核偏最小二乘(DCKPLS)模型完成废水处理过程的故障检测,以确保建模数据的可靠性。首先,该模型通过将矩阵扩充方法与核方法结合,增强了PLS模型潜变量对于废水数据动态性和非线性的解释能力;其次,通过PLS的模型分解实现并行偏最小二乘模型,进而将输入、输出变量进行较为全面地子空间划分与故障检测,有效克服了传统PLS模型存在的特征提取缺陷。基于模拟传感器故障数据得出,DCKPLS模型具备较高的故障检测率。2.针对造纸废水数据的复杂特性,提出一种基于矩阵扩充和内部结构优化的PLS预测模型。首先,分别采用高斯过程回归与相关向量机两种概率模型重构PLS得分向量间的函数关系,构建出基于高斯过程回归的偏最小二乘(GPR-PLS)模型与基于相关向量机的偏最小二乘(RVM-PLS)模型,有效克服了数据高维性、非线性以及随机性对模型造成的影响。其次,通过引入时滞变量,分别结合有限冲击响应(FIR)和外生变量自回归(ARX)两种矩阵扩充方法来优化模型的动态性能,构建出动态GPR-PLS预测模型和动态RVMPLS预测模型,使得源自于历史数据与当前数据相关性的动态特征更易把握。最后,考虑到FIR和ARX对模型的优化效果差异性显著,提出结合时滞变量的相关性分析,完成矩阵扩充方式的自适应选择。实验表明,所提出的模型具备较好的预测能力与泛化能力。