论文部分内容阅读
随着我国改革开放事业的不断发展,国民经济水平的不断提高,股票市场在经济运行中的重要地位越发突出。截至2018年6月,我国股票市场的总市值已经达到53.89万亿,约为中国2017年全年GDP的65%。十九大报告中提出“深化金融体制改革,增强金融服务实体经济能力,提高直接融资比重,促进多层次资本市场健康发展。健全货币政策和宏观审慎政策双支柱调控框架,深化利率和汇率市场化改革。健全金融监管体系,守住不发生系统性金融风险的底线”。股票市场作为最重要的直接融资渠道,直接关联投资者与实体经济,是我国资本市场的主要部分和典型形态。尝试建立更加准确的股票价格预测模型,不仅可以指导投资者的股票投资行为,有效提升股票市场服务实体经济能力,并且可以考察与防范金融风险波动,为国家维护金融稳定,严控系统性金融风险,对股市进行宏观调控有重要的指导作用和现实意义。文章选取上海证券综合指数(上证综指)表征中国股票市场整体走势,样本期为2014年1月2日至2018年5月31日,共计1076个交易日。其中,使用2014年1月2日至2017年9月6日数据作为模型的训练集,预测2017年9月7日至2018年5月31日的上证综指每日收盘指数。在详细梳理股票价格预测研究领域文献的基础上,文章从两个方向对现有研究中进行改进:一是根据有关股票价格波动的现代金融学理论,结合中国股票市场实际,从理论上建立三因素预测模型:Pt+1=f(交易信息t,投资者关注与投资者情绪t,货币政策t)。在此基础上,考虑数据的真实性、可靠性和全面性,选取开盘指数、最低指数、最高指数、收盘指数、成交量、成交金额等作为历史交易信息的代理指标,选取换手率和财经新闻情感作为投资者情绪的代理指标,选取股吧论坛用户关注和雪球网股民关注作为投资者关注的代理指标,选取一年期存款利率、上海银行间同业拆放7天期利率、美元兑人民币汇率作为货币政策的代理指标,并通过主成分分析方法构建了历史交易信息综合指数(SH指数)、投资者关注和投资者情绪综合指数(IS指数)和货币政策综合指数(MP指数);二是选用长短期记忆(long short-term memory,LSTM)神经网络技术,基于收盘指数序列构建LSTM-0模型,基于三类综合指数构建LSTM-1模型,基于所有原始指标建立LSTM-2模型,进行超参数调优,提高各模型预测能力,对比3个模型在测试集上的预测效果,LSTM-0、LSTM-1、LSTM-2模型的平均误差率为3.19%,1.65%和0.40%,基于所有原始指标的LSTM-2模型预测效果相对更优。文章实证结果表明,LSTM模型在非线性、多变量的股票价格预测问题上具有良好的应用前景,且投资者关注与投资者情绪、货币政策等对中国股市的确存在一定程度的影响,将这种影响进行合理量化后建立LSTM模型可以有效提高股票价格预测的准确度。