论文部分内容阅读
在这信息化时代,随着物联网、云计算、社交网络以及人工智能等技术的发展,浩如烟海的信息在不断的产生,海量的数据中,含有大量的时间序列数据。日益激增的时间序列数据背后,隐藏着许多具有价值的信息,然而人们在没有相关理论和技术的情况下,面对这些时间序列数据显得无能为力,如何从茫茫的时间序列数据海洋中挖掘出对人们真正有用的,具有实用价值的知识,变废为宝,成为当前人们迫切的需求。为此,越来越多的研究人员投入到时间序列预测的研究热潮当中。本文致力于提升时间序列的预测精度。首先,本文分析了优质数据对时间序列的重要性,并从数据采集的角度出发,分别从电力系统漏磁检测异常数据采集和校园网社交网站用户访问量数据采集这两个不同领域对数据采集方法进行研究与改进,从而获得优质的数据,为进一步时间序列预测的研究工作提供有效数据保障。针对时间序列预测,本文从如下两个方面进行了改进:(1)考虑到传统模型在对时间序列进行预测时,仅考虑单一时间粒度下的信息,使得预测精度低的问题,本文提出了基于多时间粒度特征构建的高斯过程回归(Gaussian Process Regression,GPR)模型;(2)针对由于时间序列变化的不确定性,导致其预测精度难以达到预期效果的问题,提出了基于离散小波变换(Discrete Wavelet Transformation,DWT)的多时间粒度特征构建高斯过程回归(GPR)和近邻加权(Weighted Nearest Neighbors,WNN)的组合预测模型。