论文部分内容阅读
间歇过程作为现代生产的主要生产方式之一,已被广泛应用于生物制药、食品加工、化学品生产等领域。在间歇过程中,通过在线测量过程变量,对过程实施监测和优化控制,有效地提高了间歇过程生产的产品质量和经济效益。软测量技术通过建立辅助过程变量与主导过程变量之间的数学模型,在线预测主导过程变量,实现了难以采用传感技术转换的过程变量的在线测量。然而,受间歇过程操作、现场测量仪表性能、离线分析等因素的影响,获得的过程数据呈现出非对称特征,主要表现为包含少量标签数据和大量无标签数据的批次过程数据,同时,间歇过程数据的非线性和多时段,使得过程数据的非对称特征进一步凸显,使用这些非对称过程数据中的标签数据直接建立软测量模型,将影响数据驱动的间歇过程软测量建模的准确性。因此,充分考虑间歇过程数据非对称特征,研究非对称数据下的多时段间歇过程软测量建模方法具有重要的理论意义和应用价值。
本文在详细分析间歇过程数据非对称特征和软测量建模方法的基础上,研究了非对称数据下的多时段间歇过程软测量建模方法。首先利用时序模糊C均值(Sequence-Constrained Fuzzy C-Means,SCFCM)聚类算法对多时段间歇过程数据进行时段划分;然后提出一种基于综合相似度即时学习(Comprehensive Similarity Just-in-time Learning,CSJITL)的无标签数据标签预测方法,该方法引入一种集成样本数据空间相似性、时段相似性和时序相似性的综合相似度因子,利用综合相似度因子构建相似样本集,建立基于JITL的局部预测模型,对无标签数据的标签值进行预测,构建了由标签数据和经过标签值预测的无标签数据组成的过程数据集;在此基础上,提出了一种基于融合特征(Fusion Features,FF)的过程数据特征提取方法,分别利用核主元分析(Kernel Principal Components Analysis,KPCA)和栈式稀疏自编码器(Stacked Sparse Autoencoder,SSAE)对过程数据集进行处理,提取过程数据的非线性特征和深层次特征,构建了扩充过程信息量的新的过程数据集以用于软测量建模;最后利用相关向量机(Relevance Vector Machine,RVM),建立了一种基于综合相似度即时学习-融合特征-相关向量机(CSJITL-FF-RVM)的多时段间歇过程软测量模型,实现间歇过程变量的在线预测。
实验研究表明,所提出的基于CSJITL的无标签数据标签预测方法,具有较高的标签值预测精度;所提出的基于FF的过程数据特征提取方法有效地实现了标签数据和经过标签值预测的无标签数据组成的过程数据集的处理,扩充了过程数据信息量,为建立间歇过程软测量模型提供了有效的训练数据;所建立的基于CSJITL-FF-RVM的多时段间歇过程软测量模型能够用于过程变量的在线预测,提高了过程变量在线预测的准确性。
本文所提出的以非对称数据处理为基础的多时段间歇过程软测量建模方法,可以用于间歇过程数据的在线预测中,能够有效地处理过程数据的非对称问题,提高间歇过程软测量模型的准确性,在生物制药、食品加工、化学品生产等领域具有很好的推广应用。
本文在详细分析间歇过程数据非对称特征和软测量建模方法的基础上,研究了非对称数据下的多时段间歇过程软测量建模方法。首先利用时序模糊C均值(Sequence-Constrained Fuzzy C-Means,SCFCM)聚类算法对多时段间歇过程数据进行时段划分;然后提出一种基于综合相似度即时学习(Comprehensive Similarity Just-in-time Learning,CSJITL)的无标签数据标签预测方法,该方法引入一种集成样本数据空间相似性、时段相似性和时序相似性的综合相似度因子,利用综合相似度因子构建相似样本集,建立基于JITL的局部预测模型,对无标签数据的标签值进行预测,构建了由标签数据和经过标签值预测的无标签数据组成的过程数据集;在此基础上,提出了一种基于融合特征(Fusion Features,FF)的过程数据特征提取方法,分别利用核主元分析(Kernel Principal Components Analysis,KPCA)和栈式稀疏自编码器(Stacked Sparse Autoencoder,SSAE)对过程数据集进行处理,提取过程数据的非线性特征和深层次特征,构建了扩充过程信息量的新的过程数据集以用于软测量建模;最后利用相关向量机(Relevance Vector Machine,RVM),建立了一种基于综合相似度即时学习-融合特征-相关向量机(CSJITL-FF-RVM)的多时段间歇过程软测量模型,实现间歇过程变量的在线预测。
实验研究表明,所提出的基于CSJITL的无标签数据标签预测方法,具有较高的标签值预测精度;所提出的基于FF的过程数据特征提取方法有效地实现了标签数据和经过标签值预测的无标签数据组成的过程数据集的处理,扩充了过程数据信息量,为建立间歇过程软测量模型提供了有效的训练数据;所建立的基于CSJITL-FF-RVM的多时段间歇过程软测量模型能够用于过程变量的在线预测,提高了过程变量在线预测的准确性。
本文所提出的以非对称数据处理为基础的多时段间歇过程软测量建模方法,可以用于间歇过程数据的在线预测中,能够有效地处理过程数据的非对称问题,提高间歇过程软测量模型的准确性,在生物制药、食品加工、化学品生产等领域具有很好的推广应用。