论文部分内容阅读
随着我国经济的飞速发展及人们投资意识的增强,股票成为日常生活中重要的投资方式之一。然而股票高风险的性质会为投资者带来巨大隐患,因此预测股票市场走势对于投资者来说具有重要意义。众所周知,股票是一个多要素的复杂系统。在利用技术方法建立股票预测模型时,由于存在输入数据变量较多、数据信息有重叠、异常值对训练影响较大等问题,模型训练速度慢且不能很好的学习到数据中隐含的规律。而且股票预测模型本身还存在着参数难以确定、在股票预测领域专用性低等问题,这些经常导致训练的股票预测模型泛化性差,预测效果欠佳。针对上述问题,本文提出选用z-score标准化方法对基础数据进行处理,消除股票数据中数值大、量纲不同、异常值等问题对训练的影响。利用主成分分析法将基础数据降维,在保留原有信息的同时降低数据维度并消除各项指标间的相关性,提高模型的分析效率与预测精度。再结合股票相关技术指标算法KDJ与MACD,通过计算得到能够表示数据中更深层隐含规律的技术指标。将各项指标值一同作为输入数据,从样本质量的角度降低模型的学习难度,提高学习效率与学习能力。同时在LSTM神经网络内部根据股票特性对神经网络结构与模型中各项参数进行调整,提高模型对股票的专用性与预测稳定性,并引入动态学习率优化收敛曲线,解决无法拟合的问题以及进一步提高模型的训练效率。最后结合随机波动模型的思想在神经网络中加入对波动率的度量,通过波动率对输出门的控制提高模型对突发情况的反应速度,增强模型的预测能力与泛用性。为了使实验具有代表性,在中国股票市场中最具代表性的A50中选择平安银行股票的真实数据进行训练以及预测。从对照结果来看,改进后基于主成分的LSTM模型在降低了预测平均误差的同时,大大减少了运行时间,提高了预测稳定性,并最终较为准确的预测了平安银行的收盘价。同时使用训练得到的模型对A50中其他股票进行预测,模型对其他股票整体趋势的预测比较准确,具有一定的泛用性。最后根据波浪理论在预测曲线中得到的买入卖出点进行操作,并使用真实数据进行对照,结果表明总体处于盈利状态,因此基于主成分的LSTM神经网络模型具有一定的应用价值。