论文部分内容阅读
量化投资依靠数理模型对投资策略和投资逻辑进行量化,并以计算机技术等现代科技为实现手段。作为近二十年来在全球范围内兴起的一种新的投资方法,其发展态势锐不可当。2004年,我国第一支量化投资基金“光大保德信量化核心证券投资基金”成立。2010年,股指期货问世,大量金融衍生品涌现,数量化金融的需求被日渐复杂的金融市场带动,量化投资开始广泛引起我国投资者的关注,业界和学术界对其研究热情逐渐高涨。
近年来,我国诸多券商机构成立了专业的金工团队,对机器学习算法在量化投资中应用展开了深入研究。而在资本市场发达的国家和地区,机器学习在量化投资领域已经有了广泛的应用。相比于传统的结构化的数据分析方法,机器学习算法对于解决噪音较大、关系复杂的金融数据,拥有更出色预测能力。
本文选择了随机森林这种利用Bagging方式集成决策树的机器学习算法,以中证500指数成分股为股票池,从质量、成长、估值、风险等多个维度共选取了39个日频因子,构建基于随机森林模型的多因子选股策略。选股模型的构建可以分为两个部分,首先利用随机森林算法对股票下一个交易日的收益率进行预测;再根据预测所得的收益率通过行业中性化的方式构建投资组合进行回测。在初始收益率预测模型的基础上,根据随机森林算法的特性,本文经过了特征因子筛选和网格参数寻优两轮优化,以提高预测的准确率。最终,因回测期内市场整体表现不佳,在收益方面,策略组合只取得了3.83%的年化收益率,但对比指数的超额收益达17.25%;在风险方面,策略组合在收益波动率和最大回撤的表现均优于同期中证500指数的表现。
近年来,我国诸多券商机构成立了专业的金工团队,对机器学习算法在量化投资中应用展开了深入研究。而在资本市场发达的国家和地区,机器学习在量化投资领域已经有了广泛的应用。相比于传统的结构化的数据分析方法,机器学习算法对于解决噪音较大、关系复杂的金融数据,拥有更出色预测能力。
本文选择了随机森林这种利用Bagging方式集成决策树的机器学习算法,以中证500指数成分股为股票池,从质量、成长、估值、风险等多个维度共选取了39个日频因子,构建基于随机森林模型的多因子选股策略。选股模型的构建可以分为两个部分,首先利用随机森林算法对股票下一个交易日的收益率进行预测;再根据预测所得的收益率通过行业中性化的方式构建投资组合进行回测。在初始收益率预测模型的基础上,根据随机森林算法的特性,本文经过了特征因子筛选和网格参数寻优两轮优化,以提高预测的准确率。最终,因回测期内市场整体表现不佳,在收益方面,策略组合只取得了3.83%的年化收益率,但对比指数的超额收益达17.25%;在风险方面,策略组合在收益波动率和最大回撤的表现均优于同期中证500指数的表现。