论文部分内容阅读
关于时间序列的问题涉及经济、气象、水利、林业等多个领域,目前对于时序数据的挖掘是数据挖掘研究的热点之一,具有很强的理论意义和实际应用意义。而由于时序数据挖掘的应用背景广泛,同时时序数据具有时变性、高维性、噪声干扰及波动性等复杂特点,时序数据挖掘一直是数据挖掘领域的研究难点之一。过程神经网络是传统神经网络在时间域上的拓展,其过程式输入放宽了传统神经元网络模型对于输入的同步瞬时限制,是更一般化的人工神经元网络模型,在处理与时间相关的问题上,具有自身独特的优势。本文将过程神经网络引入时序数据挖掘中,结合小波多分辨分析等相关技术,对时序背景下的聚类、分类、预测等问题展开深入地研究。首先,针对时序背景下的聚类问题,提出一种基于小波和改进自组织过程神经网络的时序聚类方法,应用小波变换对原时序数据进行小波分解,在保留相关聚类特征的原则下,对信号进行重构。然后将重构信号拟合为时变函数作为过程神经网络的输入,应用改进的竞争算法训练自组织过程神经网络,利用过程神经网络输入为时变函数的特点,将经小波处理后的时序信号特征充分纳入到聚类分析中,网络提取输入函数隐含的过程式模式特征并进行自组织,给出了改进的竞争学习算法。最后应用UCI数据集进行仿真实验结果表明,该方法能有效应用于时序聚类中。其次,针对时序分类问题,提出一种竞争型径向基过程神经网络时序分类器。首先给出了竞争型径向基过程神经网络的拓扑结构,引入复合竞争过程神经元隐层,将连续时间点上的离散数据拟合为时变函数作为网络的输入,突破了时序数据不等长的限制,由复合竞争过程神经元单元完成对过程式输入信息的模式匹配和时空聚合运算,省去了输出层线性连接权的计算,简化了网络结构和训练过程。然后针对各聚类大小及网络训练结果,采用不同的聚类系数,提高了分类器的泛化能力,给出了具体的学习算法。最后以多变量时序分类仿真数据验证了分类器的性能和有效性。再次,在时序预测方面,提出两种用于预测的过程神经网络模型。一是遗传过程神经网络模型,在将输入数据表示成一组正交基展开式的基础上,引入移民算子,应用改进的遗传算法优化遗传过程神经网络的训练过程,应用人均GDP预测问题和对比分析验证了模型的预测精度和泛化性能。二是提出一种改进的前馈过程神经网络模型,给出了组合式过程神经网络学习算法并应用于CPI预测研究中,结果表明,该模型的预测精度明显高于传统神经网络模型。最后,针对时序背景下的控制问题,提出一种基于前馈过程神经网络的时序控制和非线性系统辨识方法。首先基于时序控制问题的时变性特点及复杂非线性特征,将前馈双隐层过程神经网络引入到时序控制和非线性系统辨识当中,利用过程神经网络处理时变特征问题的优势,将时变和非线性特征充分纳入到时序控制中,并说明了该模型应用于时序控制的优势。然后针对具体木材干燥过程控制的特点,应用改进的学习算法训练过程神经网络,得到两种水曲柳木材干燥控制模型。两种模型与传统神经网络模型比较分析结果表明,过程神经网络模型具备更好的预测精度和泛化能力,其性能优于传统BP神经网络模型,过程神经网络应用于时序控制和非线性系统辨识问题是可行的。本文工作围绕时序数据挖掘的若干问题展开,其中涉及到聚类、分类和预测的若干方法和模型,并通过实验、实例验证和比较分析的方式验证了方法和模型的性能和有效性,其中时序聚类和时序分类器的研究为进一步时序数据挖掘研究的拓展提供了较好的理论基础和思路。