论文部分内容阅读
金融是现代经济的核心,也是调控宏观经济的重要杠杆,它对于人类社会具有非常重要的作用。金融具有两面性,带给我们利益的同时也带来一系列消极影响,如通货膨胀、金融泡沫、金融危机等。为使金融带来的负面影响降至最低,对金融的相关分析则至关重要,金融的分析可以通过对其建立时间序列模型来实现。所谓金融时间序列是指金融相关数据按时间顺序排列而成的数列,对金融时间序列的分析能够直接的反应出金融的活动规律。金融时间序列中包括股票数据按既定时间顺序的排列,对股票数据的走势预测分析可侧面反映出金融市场的活动趋势。在金融时间序列中,不同时刻的数据之间必然存在着一定的关系,但金融市场的影响因素众多而且复杂,导致这种关系很难用清晰的数学模型刻画出来,这一点对于金融时间序列的分析和预测有着重要的影响。在自然语言处理领域,已有研究通过所谓的嵌入向量表示方法将文本的上下文在语法语义上的连贯关系刻画出来,那么同样的前后具有关联的金融时间序列,是否可以使用嵌入向量思想将这种关联表现出来,进一步实现金融时间序列的预测,正是本文所要研究的主要内容。论文的主要工作可以归纳为两方面:首先通过引入嵌入向量思想提出了金融日向量和金融周向量两种金融时间序列的表示方法,以表示这些向量在时间序列中的“上下文”相关性;之后采用提出的金融嵌入向量表示模型,对金融时间序列进行了预测。传统嵌入向量是指词嵌入向量和句子嵌入向量,在自然语言处理领域中的应用主要是对文本进行分析。文本中所包含的词的个数是有限的,而金融时间序列一般是连续的,因此要将嵌入向量的思想应用于金融时间序列分析中,首先需要采用离散化方法将金融数据映射到一个有限的集合,之后便可将嵌入向量应用于金融时间序列分析中。与“词嵌入向量”相对应,我们可以得到所谓“金融日向量”,即将某一个离散化之后的股市数据映射为一个实数向量,其对应的是单个交易日的信息。与“词嵌入向量”类似,得到的“金融日向量”之间能够反映出它们在金融时间序列中的连贯关系。类似的,与“句子嵌入向量”相对应,我们得到了所谓“金融周向量”,将周一到周五连续5天交易日的股市数据映射为一个实数向量,对应的是股市一周的信息。为验证嵌入向量在金融时间序列应用的可行性,本文将所提出的方法应用于标准普尔500指数数据集。选取5种相关的股市参数作为原始数据,即开盘价、最高价、最低价、收盘价、交易量5个参数进行分析。首先对数据集进行离散化,并使用本文提出的方法进行训练得到金融嵌入向量:“金融日向量”和“金融周向量”,之后选用径向基函数(Radial Basis Functions,RBF)神经网络作为预测模型,利用得到的金融嵌入向量,分别对日收盘价和周收盘价进行预测分析。实验的结果表明,金融日向量和金融周向量能够实现对收盘价的预测,与使用原始股市数据相比取得了更好的效果。嵌入向量的思想为金融时间序列分析提供了一种新的思路。