基于多源数据融合的股票波动预测研究与实现

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:HillTang00009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的股票波动预测方法主要依靠量化交易数据。随着大数据时代的到来,研究者开始从网络中提取有效的特征(例如事件和情感)来提升预测性能。融合异构的多源数据来更加准确的预测股票波动仍是一项充满挑战的工作。现有的解决方案大多采用传统的机器学习模型,受限于模型的容量,可能无法有效地建模多源数据之间的复杂交互。为此,本文充分利用股票市场的多源数据,提出了有效的数据融合模型以提高股票波动预测的准确性。本文提出量化数据与文本数据特征提取与融合预测方法。首先使用小波变换来捕获量化时间序列数据高频和低频的波动趋势。具体来说,先利用离散小波变换分解得到高低频子序列,再使用小波神经网络分别拟合子序列。此方法可以充分挖掘时间序列的特征。其次,面向股票相关的文本数据建模一个多任务模型,用于提取高质量的文本特征。先分别训练基于深度双向预训练语言理解模型的新闻表示和社交网络帖子情感分析的单任务模型,再使用单任务模型的输出结合真实标签去训练多任务模型,此方法相较知识蒸馏和标准多任务训练方法更能提升文本特征的质量,进而提升模型的预测性能。接着,融合量化特征和文本特征进行股票波动预测。为了探究特征之间的关联关系,本文提出了一种基于多源数据特征交互的股票波动预测方法,分别使用因子分解机和深度神经网络对低阶和高阶特征的交互关系进行建模,并通过注意力机制将股票之间的关联关系纳入模型。最后,在2015年至2017年的中国股票市场数据上进行实验,结果表明了我们模型的有效性。
其他文献
本文首先对现代企业经理人追求其效用最大化的行为进行了理论分析.在此基础上,以2000年前A股在沪深证券交易所上市的894家上市公司为样本,采用实证方法讨论了经理人行为对公
在高阶统计量的基础上提出了高阶倒谱的概念,利用信息熵作为其结果的量化指标,应用于齿轮的故障诊断中.由于高阶倒谱同时具备了高阶统计量和倒谱的优点,因此在进行齿轮的故障
分类讨论思想即把需要研究的问题根据题目特点和要求分成若干类,转化成若干个小问题进行解决。在高中数学解题中较为常见。高中数学知识复杂繁多,题目难度较大,运用分类讨论
为研究钢包底吹孔布置对钢液混匀时间及液面波动的影响,确定钢包最优底吹工艺,以某厂210 t钢包为原型,根据相似原理建立钢包物理模型,模拟钢包底吹氩工艺。通过研究不同底吹
高校开设太极拳课程的目的不仅是提高学生的身体素质,还有助于学生颐养生情。然而目前,高校太极拳教学中还存在一些不足之处,需要我们尽快采取对策解决。
随着时代的不断进步,国内对于中学生心理健康这一问题的重视程度越来越高,因此就出现对该方面的多项理论、实践研究,具体研究影响中学生心理健康的因素。文章顺应潮流,对中学
【正】 威廉·冯特(1832~1920年)是德国资产阶级唯心主义的哲学家,是近代心理学的奠基人之一。 我们认为,冯特心理学表面上采取“身心二元论”的理论形式,企图凌驾于唯物