面向多元时间序列的特征分析与建模

来源 :山东财经大学 | 被引量 : 0次 | 上传用户:sentown
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,各个领域对时间序列数据的研究不断增长。时间序列数据本质上是随机过程的实现,是一系列以时间为索引的随机变量。而时间序列预测则是利用各种时间序列分析方法挖掘时间序列内部规律,估计序列未来数据。效果优异的预测模型能够帮助研究者更好地进行分析和决策,减轻各种不稳定因素产生的负面影响。因此,时间序列预测技术得到飞速发展,已成为数十年来的热门研究主题。时间序列预测模型在解释复杂的现实世界元素中起着重要作用。近年来,随着数据数量和维度的急剧增加,如何提取时间序列的深层特征,识别数据内部的潜在模式已成为时间序列预测领域新的难点和挑战。深度学习由多个处理层组成,可以进行多个级别的抽象学习,现在已经成为克服困难的有效方法。但是时间序列数据具有复杂特性,单一的深度学习模型难以挖掘时间序列的内部特性和外部驱动关系。为此,本文在对各种深度学习技术进行了深入研究的基础上,提出了以下两种时间序列特征建模方法:1.提出了面向时间序列预测的自适应频域建模方法。研究发现,时间序列预测依赖于不同的频率模式,为未来的趋势预测提供有用的线索:短期的序列预测更多依赖于高频分量,而长期预测则更多关注低频数据。为更好地挖掘时间序列的多频模式,本文提出面向时间序列预测的自适应频域建模方法,针对时间序列内部蕴含的频域信息建模。该方法主要分为两个阶段:在第一阶段中,模型通过XGBoost算法对输入向量进行重要性度量,选择高重要性特征。在第二阶段,模型将时间序列的频率特征提取和目标序列的频域建模集成到一起并根据时间序列对频率模式的依赖特点提出一种新颖的预测网络,该网络能够根据输入序列的动态演变自动关注不同的频率分量,从而揭示时间序列的多频模式,强化模型的学习能力。最终,通过大量仿真实验证明本文设计的预测模型在时间序列预测中有较高的预测精度,在实际的分析中也具有较高的应用价值。2.提出面向时间序列预测的分层注意力网络。对于过于复杂的时间序列,单纯的捕捉序列时间域特征,并不能很好地识别深层潜在模式。为此,本文采用编码器解码器架构设计了一种分层注意力网络。首先,在编码器部分采用卷积神经网络来学习外源数据不同组成部分之间的空间相互作用,并通过多层循环神经网络将外部数据汇总为不同级别的不同信息,以便充分利用和建模其时间动态。在解码器阶段,采用另一个多层循环网络,并通过多层注意力机制在不同级别上对不同的信息执行操作,以在预测中选择相关信息。实验证明,提出的模型不仅可以提高时间序列预测的精度,而且还可以捕获时间序列的突然变化和振荡。
其他文献
数据包络分析(Data Envelopment Analysis,DEA)作为一种衡量相对效率和排序同质决策单元的方法,广泛应用于金融、医疗等诸多领域。传统的数据包络分析模型要求投入和产出均为精确数,但在实际应用中,我们有时无法获得精确的投入和产出数据,比如一些定性指标,很难精确量化到DEA模型中。模糊数可以很好的表示不确定信息,因此,基于模糊数的模糊DEA研究,引起了广泛关注。此外,传统数据包络
学位
随着数据采集与存储技术的发展,数据规模量急剧增长的同时,不可避免地会存在大量的异常数据,数据的准确性问题严重制约着大数据时代的决策质量,统计数据的准确性检验成为人们关注的重点问题。文献研究发现,应用了几十年的Benford法则,存在着一定的问题。本文在综述了国内外数据质量准确性检验方法与大数据技术算法的基础上,归纳分析了Benford法则优势和局限性,引入Boosting算法与Benford法则相
学位
学位
学位
学位
学位
学位
学位