论文部分内容阅读
随着大数据时代的到来,各个领域对时间序列数据的研究不断增长。时间序列数据本质上是随机过程的实现,是一系列以时间为索引的随机变量。而时间序列预测则是利用各种时间序列分析方法挖掘时间序列内部规律,估计序列未来数据。效果优异的预测模型能够帮助研究者更好地进行分析和决策,减轻各种不稳定因素产生的负面影响。因此,时间序列预测技术得到飞速发展,已成为数十年来的热门研究主题。时间序列预测模型在解释复杂的现实世界元素中起着重要作用。近年来,随着数据数量和维度的急剧增加,如何提取时间序列的深层特征,识别数据内部的潜在模式已成为时间序列预测领域新的难点和挑战。深度学习由多个处理层组成,可以进行多个级别的抽象学习,现在已经成为克服困难的有效方法。但是时间序列数据具有复杂特性,单一的深度学习模型难以挖掘时间序列的内部特性和外部驱动关系。为此,本文在对各种深度学习技术进行了深入研究的基础上,提出了以下两种时间序列特征建模方法:1.提出了面向时间序列预测的自适应频域建模方法。研究发现,时间序列预测依赖于不同的频率模式,为未来的趋势预测提供有用的线索:短期的序列预测更多依赖于高频分量,而长期预测则更多关注低频数据。为更好地挖掘时间序列的多频模式,本文提出面向时间序列预测的自适应频域建模方法,针对时间序列内部蕴含的频域信息建模。该方法主要分为两个阶段:在第一阶段中,模型通过XGBoost算法对输入向量进行重要性度量,选择高重要性特征。在第二阶段,模型将时间序列的频率特征提取和目标序列的频域建模集成到一起并根据时间序列对频率模式的依赖特点提出一种新颖的预测网络,该网络能够根据输入序列的动态演变自动关注不同的频率分量,从而揭示时间序列的多频模式,强化模型的学习能力。最终,通过大量仿真实验证明本文设计的预测模型在时间序列预测中有较高的预测精度,在实际的分析中也具有较高的应用价值。2.提出面向时间序列预测的分层注意力网络。对于过于复杂的时间序列,单纯的捕捉序列时间域特征,并不能很好地识别深层潜在模式。为此,本文采用编码器解码器架构设计了一种分层注意力网络。首先,在编码器部分采用卷积神经网络来学习外源数据不同组成部分之间的空间相互作用,并通过多层循环神经网络将外部数据汇总为不同级别的不同信息,以便充分利用和建模其时间动态。在解码器阶段,采用另一个多层循环网络,并通过多层注意力机制在不同级别上对不同的信息执行操作,以在预测中选择相关信息。实验证明,提出的模型不仅可以提高时间序列预测的精度,而且还可以捕获时间序列的突然变化和振荡。