论文部分内容阅读
随着全球经济与股市的快速发展,股票投资成为了民众们常用的理财方式之一。量化投资的出现为投资者们了提供新的投资工具,其凭借纪律性、准确性、时效性和系统性等优势,让其逐步从机构投资者向个人投资者中普及。近年来,随着人工智能技术飞速发展,机器学习被越来越多的学者运用到了量化投资研究中。本文使用2013年1月1日至2019年12月31日沪深300所有成分股数据为研究对象。其中,采用2013年1月1日至2017年12月31日期间的数据进行机器学习模型训练和超参数调整,2018年1月1日至2019年12月31日期间的数据进行量化选股策略回测。主要研究内容包括:(1)五个机器学习模型对股价未来涨跌方向的预测能力对比;(2)基于机器学习模型构建的量化选股策略在不同持仓数下的对比分析;(3)基于平均分配与等权分配资金方式构建的量化选股策略的对比分析。首先,使用主成分分析法对选取的23个特征进行降维处理,将支持向量机、逻辑回归、K近邻、随机森林、XGBoost五大机器学习算法应用于对股价未来15日涨跌方向预测。实证结果表明,随机森林和XGBoost预测性能最佳,准确率分别为69.76%和78.51%,支持向量机与K近邻其次,在60%左右,逻辑回归预测性能最差,仅有55.62%。其次,将五个机器学习模型运用于量化选股策略研究中,通过回测发现基于逻辑回归、XGBoost、随机森林模型构建的量化策略有不错的表现。通过买入上涨概率较大的股票方式进行持仓限制,与不限制持仓数相比,此方式并没有表现出明显的优势。随机森林与XGBoost平均分配资金方式下表现更好,支持向量机、K近邻在两种资金分配方式下收益效果都不佳,逻辑回归在两种资金分配方式下没有明显区别。