论文部分内容阅读
时间序列预测是通过对有限个历史观测样本进行分析来建立模型,并利用模型来解释数据之间的统计规律,以期达到控制和预报目的的一门学科,在众多领域中都有非常广泛的应用。对于时间序列的建模和预测,目前已经有了许多成熟的技术和方法,但传统时间序列预测方法往往依赖大量的历史数据,而在实际问题中由于不确定性的广泛存在导致历史数据往往是不完整的、不准确的和含糊的,因而限制了传统预测模型的应用。为了解决这些问题,Song和Chissom提出了模糊时间序列的概念,其主要是在传统时间序列预测的基础上引入了模糊理论,通过建立相应的模糊逻辑关系进行预测。由于模糊时间序列在处理数据的不确定性和模糊性方面上所显示的优势,关于它的研究也得到了越来越多的关注。经过多年的研究和论证发现模糊时间序列模型中论域的划分、语言值个数选取、数据模糊化、模糊逻辑关系的构建、预测值的修正是提高模型预测精度的几个重要部分。目前已有众多学者针对上述某些方面进行改进与创新,提出了各种各样的模糊预测方法,但这些方法在某些方面依然存在不足,本文在前人工作的基础上针对以上几个方面提出新算法对模糊时间序列中存在的问题进行了研究。 在论域划分和语言值个数选取上,目前的研究表明合理地划分论域十分重要,间隔长度的确定将极大地影响预测结果,有效的论域划分有助于预测精度的提高。而间隔长度的确定也取决于区间划分的个数。在论域划分上,有些学者提出使用聚类算法,其中最具有典型、最受欢迎的是模糊C均值聚类算法,但模糊C均值聚类算法聚类数目具有人为主观性确定的缺点,基于此,本文提出引入模糊熵的概念来确定最优聚类数目,从而对论域进行有效地划分。 在数据模糊化上,目前的研究普遍采用主观定义模糊集的方法,该方法简单,经研究发现在建立基于模糊逻辑关系分组时变模型时,不同的定义方法对其没有影响,但在建立基于模糊逻辑关系方程时变模型时,结果出现数据钝化,不能真实反映数据的分布。基于此,本文在数据模糊化时提出了一种建立模糊集定义的方法---基于模糊等价关系聚类的隶属函数的构造,该方法不仅避免了主观定义模糊集合的方法,还与前面划分区间个数紧紧相关,突出了样本的内部结构。 在模糊逻辑关系的构建上,目前的研究表明逻辑关系的阶次极大的影响预测精度且并不是阶次越高,预测结果越好。已有的研究中,大部分学者通常采用一阶模型,这是因为一阶模型计算方便,为了给出逻辑关系阶次确定的合理解释,本文采用传统时间序列自相关函数的概念来确定模型的阶数。 为了提高预测结果的精度,目前众多学者将先进算法引入到模糊时间序列中,同时考虑到混合算法可以显著的提高整体模型的预测精度,因此,本文在最终预测结果的基础上提出使用残差GM(1,1)模型对预测值进行修正,实验结果表明预测精度得到提高。 最后,针对大样本和小样本数据分别将本文的方法用于阿拉巴马州州立大学入学人数和台湾1998/01-2001/12机械行业产品价值的预测,对本文方法的结果与现有模型的结果进行对比,发现本文模型的预测精度较高。