论文部分内容阅读
传统金融学和现代行为金融学都认为股票市场的波动受到信息发布、传播、公众接受的影响。早期的股价预测研究主要是对股票历史交易数据进行分析处理,从中挖掘对股价走势判断有利的特征,随着人工智能、自然语言处理技术等技术的发展,从新闻媒体中提取能够反映宏观经济、基本面以及影响投资者情绪的信息变为可能,研究者开始将新闻文本数据与股票交易数据结合对股价进行预测。
利用新闻进行股价预测的关键之一是准确提取新闻中包含的信息。目前,主流的新闻信息表征方式主要包括运用词袋法把新闻表示为一个实值向量和借助词向量把新闻表示成一个文本矩阵等。然而,运用这两种方法表征新闻信息的过程都存在明显不足。一方面,词袋法容易造成信息损失,准确表达信息的能力不足,只能捕捉到文本中有限的信息;另一方面,在利用Word2Vec、GloVe等词向量对新闻信息进行表征的过程中,由于词向量模型本身的局限性,使得其对新闻中的情感信息捕捉不足,因而也无法充分准确地表征新闻内容。受到GloVe启发,为了更准确的表征新闻信息,我们在词向量空间引入了额外的情感信息,提出一种新的词向量模型——Senti-GloVe,该方法兼顾新闻文本中的语义和情感信息,可以帮助更好的表征新闻并提取新闻特征。
在新闻信息得以正确表征的基础上,如何准确量化市场信息对证券市场波动的影响成为股价预测研究关注的焦点。近年来,深度学习方法在股价预测上得到广泛应用。不同的深度学习模型具备不同的特点,如卷积神经网络善于捕捉数据中的局部特征;长短期记忆神经网络适合处理时间序列数据;自注意力模型可以更好地建立输入序列之间的依赖关系。为充分发挥各类深度学习模型的优势,提升模型性能,本文提出利用集成学习思想,组合各类深度学习模型,构建一个端到端的深度集成股价预测模型;同时,利用迁移的训练方案,提升基础模型与集成模型的股价预测性能。
本文的主要贡献如下:(1)提出了一种新的考虑新闻情感的词向量模型——Senti-GloVe,借助它我们可以更好地表征新闻,从新闻中提取有利于股价预测的新闻语义、情感特征;此外,Senti-GloVe词向量还可以帮助提升情感分析任务的性能;(2)设计了一个股价预测模型架构,利用特征工程对股票交易数据进行处理,通过不同的深度学习模型对交易数据建模得到交易数据特征,通过不同的词向量表征新闻并得到新闻特征,将二者结合对股价涨跌情况做出预测,验证Senti-GloVe词向量对股价预测的积极作用;(3)构建了一个端到端的深度集成股价预测模型,把不同深度学习模型得到的交易数据特征进行融合,提升模型的泛化能力,并通过迁移的训练方案,在训练过程中让集成模型指导基础模型学习,进一步提升股价预测模型性能。本文在新闻特征提取、股票价格预测两个方面做出了积极的探索,为相关研究领域的研究者提供了一定的参考,具有一定的现实意义。
利用新闻进行股价预测的关键之一是准确提取新闻中包含的信息。目前,主流的新闻信息表征方式主要包括运用词袋法把新闻表示为一个实值向量和借助词向量把新闻表示成一个文本矩阵等。然而,运用这两种方法表征新闻信息的过程都存在明显不足。一方面,词袋法容易造成信息损失,准确表达信息的能力不足,只能捕捉到文本中有限的信息;另一方面,在利用Word2Vec、GloVe等词向量对新闻信息进行表征的过程中,由于词向量模型本身的局限性,使得其对新闻中的情感信息捕捉不足,因而也无法充分准确地表征新闻内容。受到GloVe启发,为了更准确的表征新闻信息,我们在词向量空间引入了额外的情感信息,提出一种新的词向量模型——Senti-GloVe,该方法兼顾新闻文本中的语义和情感信息,可以帮助更好的表征新闻并提取新闻特征。
在新闻信息得以正确表征的基础上,如何准确量化市场信息对证券市场波动的影响成为股价预测研究关注的焦点。近年来,深度学习方法在股价预测上得到广泛应用。不同的深度学习模型具备不同的特点,如卷积神经网络善于捕捉数据中的局部特征;长短期记忆神经网络适合处理时间序列数据;自注意力模型可以更好地建立输入序列之间的依赖关系。为充分发挥各类深度学习模型的优势,提升模型性能,本文提出利用集成学习思想,组合各类深度学习模型,构建一个端到端的深度集成股价预测模型;同时,利用迁移的训练方案,提升基础模型与集成模型的股价预测性能。
本文的主要贡献如下:(1)提出了一种新的考虑新闻情感的词向量模型——Senti-GloVe,借助它我们可以更好地表征新闻,从新闻中提取有利于股价预测的新闻语义、情感特征;此外,Senti-GloVe词向量还可以帮助提升情感分析任务的性能;(2)设计了一个股价预测模型架构,利用特征工程对股票交易数据进行处理,通过不同的深度学习模型对交易数据建模得到交易数据特征,通过不同的词向量表征新闻并得到新闻特征,将二者结合对股价涨跌情况做出预测,验证Senti-GloVe词向量对股价预测的积极作用;(3)构建了一个端到端的深度集成股价预测模型,把不同深度学习模型得到的交易数据特征进行融合,提升模型的泛化能力,并通过迁移的训练方案,在训练过程中让集成模型指导基础模型学习,进一步提升股价预测模型性能。本文在新闻特征提取、股票价格预测两个方面做出了积极的探索,为相关研究领域的研究者提供了一定的参考,具有一定的现实意义。