论文部分内容阅读
目前,预测已经成为一门重要的学科。随着预测科学的发展,非线性预测方法成为当前研究的热点。集成学习方法作为机器学习研究领域的四大主题之一,越来越受到研究者的关注。作为一种相当有效的机器学习方法,集成学习已经广泛地用于公司财务困境、汇率预测及文本挖掘等研究领域。公司的盈利能力是投资者普遍关注的焦点。盈利预测也成了最近许多研究者研究的主题。盈利预测准确与否,关系到广大投资者的切实利益。因此,为了能使预测更加准确,许多预测方法被用于盈利预测中。但是,现有研究采用的方法得到的盈利预测准确率并不高。因此,如何应用新的更为有效的方法来进行预测,是一个迫切需要解决的问题。本文在对有关盈利预测的相关文献进行分析的基础上,指出了现有研究存在的主要问题。在此基础上,本文对集成学习方法用于盈利预测的机理进行了分析。考虑到盈利预测问题是个复杂的非线性问题后,本文运用以决策树和BP神经网络作为基学习器的集成学习方法预测公司未来盈利状况。本文对所建立的集成学习模型进行了实证研究。实证研究选取的数据样本是沪深两市2001年至2007年A股上市公司的年报数据。其中,2007年的数据作为测试样本。在剔除了那些在中途上市或财务变量中含有大量缺失值的公司后,本文对所得到的样本数据进行了预处理,包括缺失值、奇异值的处理。此外,为了使数据符合神经网络方法的要求,本文对其进行了归一化处理。将各财务变量的范围归一到[-1,1]。为了更贴近实际和更好地指导投资者,本文将目标变量(每股收益)划分为三类。利用选取的财务变量和目标变量的数据集训练得到作为集成学习基学习器的决策树模型和神经网络模型后,本文分别用决策树集成学习方法和神经网络集成方法预测了上市公司在2007年时的盈利状况。结果表明,两种集成学习方法的预测结果都比单个决策树或者神经网络模型的稳定性好。