基于机器学习分类算法的新股开板当曰再封板预测及策略应用研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:ttttt2046
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本研究在系统性地综述了国内外量化投资发展状况与机器学习分类算法在量化投资应用研究成果的基础上,着重阐述了 BP神经网络、随机森林、支持向量机三种监督性分类算法的概念与原理,结合2014年年初以来我国A股市场新股上市之后所呈现的连续一字涨停板现象,首创性地将各分类算法应用于预测新股开板后当日能否再次封住涨停板的应用场景中;在界定了具有“IPO后打开一字涨停板当天能够重新封住涨停板”特征的新股样本作为分类预测对象的同时,较为深入地结合了股市基本面分析框架,选择了上市公司的规模、估值、盈利等自身的特质变量以及市场或行业热度及风格转换等不同维度与类型的外部市场变量构建了七个样本输入特征对各分类模型进行了监督性训练及参数优化,筛选出了三种算法在本研究情境下的最优参数模型,构建了一套完整的基于这三个分类预测模型的新股开板后博求再封板的短期交易策略,并对不同参数维度下的新股交易策略进行了样本内回溯测试与样本外模拟交易测试,主要得出了以下几点结论与新股短期交易建议:1.从交易策略的标的选择上看,若不对打开一字涨停板的新股进行一定的过滤而直接对所有新股在打开涨停板后均进行短期追多投机交易,从长期来看是一个大概率会造成净值亏损的交易策略,而若能够有效地筛选出本研究所界定的“在打开涨停板当日能够再次封住涨停板”特征的新股且仅对这部分新股进行短期追多交易,则能够获得较高的收益风险比。2.对于任意新股,买入后不宜持有过长时间,在1-3个交易日内选择股价高点进行择机卖出该新股是较为合理的操作方案。3.三个模型预测表现方面,最优参数下的随机森林对样本内与样本外的预测准确度皆为三者中最高,具有良好的抗过拟合特性。在犯错误预测类型方面,最优参数下的随机森林犯“弃真”错误的概率显著低于支持向量机与BP神经网络,而最优参数下的支持向量机犯“取伪”错误的概率则显著低于随机森林与BP神经网络。4.在本研究构建的7个特征变量中,“开板前所属行业热度”、“开板前所属指数板块热度”以及“招股说明书中的业绩预告”等变量对分类预测的方差贡献度较高,其余变量则相对较低。
其他文献
分析了低温环境下露天矿60t自翻车制动梁吊环破断的原因,采用在失效吊环上取材加工试样的方法进行系列冲击试验,研究了三种热处理工艺对吊环用钢冲击韧性的影响。
目的对静脉用药调配中心(PIVAS)不合理医嘱进行分析,了解不合理医嘱情况,制定我院《临床常用静脉用药注意事项》,保证临床用药安全、合理、有效。方法于2018年9月选取我院静
本文在分析了钻机承载特点、疲劳强度和静强度计算方法后,认为吊环按静强度计算加安全裕量是一种简便的、有效的计算方法。只要加强质量管理,吊环的安全使用是可以保证的。
在经济全球化、科技全球化时代,跨国公司依托其雄厚的经济和技术实力,在全球化浪潮中扮演着举足轻重的角色.由于技术创新日益成为获取高额利润、提高企业竞争力的重要手段,跨
<正>陕西粮食生产现状"十一五"期间,陕西省粮食产值占农业总产值的比重为30%—40%。2004-2010年,全省粮食连续7年获得丰收,粮食生产总量依次为:1160万吨、1140万吨、1042万吨
首先简要概述电力企业纪检监察工作的内容及背景,其次阐释提升电力企业纪检监察管理人员素质的重要性,然后详细论述电力企业纪检监察管理人员应具备的素质,深入剖析当前我国
目的:探讨卡前列素氨丁三醇联合缩宫素治疗子宫收缩乏力性出血的临床效果。方法:选取2015年6月~2017年6月本院收治的112例子宫收缩乏力性出血产妇,利用随机数字表法分为两组,
电视深度报道中的兴奋点熊劲松什么是兴奋点?按《现代汉语词典》解释:兴奋就是振奋、激动。从电视新闻的角度来看,我们认为,兴奋点就是能使观众特别感兴趣,让人振奋、激动的某一点