论文部分内容阅读
随着工业大数据时代的来临,发展基于数据的建模方法显得尤为重要。基于工业过程数据的建模问题,一个重要的挑战是收集到的数据含有噪声。传统的基于工业过程输入输出数据的建模方法只考虑输出测量数据存在噪声,而忽略输入测量数据存在噪声,会导致已建立的模型存在较大的偏差甚至是无效的。变量误差(EIV)系统是一种考虑可观测或测量输入输出数据均含有误差的系统。传统的EIV系统并没有考虑输入生成动态过程,本论文针对具有输入生成动态过程的 EIV系统进行研究,主要内容如下: (1)针对具有线性输入生成过程的线性 EIV系统进行研究,即线性 EIV系统包括线性输入生成过程和线性 EIV过程。通过分析线性 EIV系统中所有可观测或测量变量之间的因果关系,提出合成线性 EIV模型,合成线性 EIV模型考虑了线性 EIV系统中所有观测或测量变量对被估计的输入变量(实际输入)产生的影响。进一步,基于期望最大化算法估计合成线性 EIV模型的参数。最后,采用数值仿真例子及混合水箱实验验证了提出方法的有效性。 (2)考虑到工业过程本身具有非线性性,对非线性 EIV系统进行研究。其中非线性 EIV系统是由非线性输入生成过程和非线性 EIV过程组成。考虑到直接辨识非线性 EIV系统存在较大的困难,采用多个线性 EIV模型逼近非线性 EIV模型的思想,对非线性模型进行辨识。通过分析非线性 EIV系统中所有观测或测量变量之间的因果关系,提出了合成非线性 EIV模型。在提出的合成非线性 EIV模型中,设计了一种并行粒子滤波的策略用于估计每个线性 EIV模型的实际输入(被估计的状态),即对多个线性 EIV模型中的每一个线性模型均执行一个粒子滤波,且与多个线性 EIV模型相对应的多个粒子滤波并行执行。进而,在最大似然的估计框架下,基于采集到的非线性 EIV系统的输入输出数据,通过期望最大化算法对提出的合成非线性 EIV模型的参数进行估计。数值模拟例子和实验例子验证了提出方法的有效性。 (3)考虑到工业过程可观测或测量数据通常存在异常观测数据,针对非线性EIV系统,提出了一种鲁棒辨识方法。考虑到 t分布可以通过调整自由度,有效地解决异常观测数据对辨识过程造成的干扰。采用 t分布对测量噪声进行建模,而不是传统的高斯分布。进一步,为了避免直接辨识非线性模型的复杂性,提出了采用多个鲁棒线性模型近似非线性 EIV系统。进而,考虑指数函数作为权重函数加权合成多个鲁棒线性局部模型的输出得到非线性 EIV系统的全局输出。在极大似然估计的框架下,通过期望最大化算法同时估计得到每个鲁棒线性局部模型的参数及权重函数的参数。最后,提出方法的有效性通过使用数字仿真例子及实验例子进行了验证。 (4)基于变分贝叶斯方法,针对存在异常观测数据的非线性 EIV系统,提出了一种鲁棒辨识方法。基于观测或测量得到的非线性 EIV系统的输入输出数据,在贝叶斯框架下,通过使用变分贝叶斯期望最大化算法,解决了非线性 EIV系统的参数估计问题,得到了非线性 EIV系统模型参数的分布,而不是参数的点估计。并通过一个连续发酵过程作为仿真例子及一个三串联水箱系统作为实验例子验证了提出方法的优越性。 最后,对本论文的研究内容进行了总结,并对下一步的研究工作和相关问题进行了展望。