论文部分内容阅读
股票市场是证券业和金融业必不可少的重要组成部分,受到投资者的普遍关注。有效的股票预测在金融投资领域占有重要地位,因此对股票价格进行分析和预测有着非常重大的理论意义和实践价值,但是由于股票受到政策、经济、以及投资人心理等诸多复杂的因素的影响,而且这些因素是没有确定规则的,这无疑给股票的预测带来了难度。 数据挖掘技术发展到今天,已经显示出非常强大的生命力。有人甚至已经把数据挖掘对我们的影响与火和网络的发明相提并论,其研究成果也已广泛应用于金融、医疗保健、零售、制造业、工程与科学等行业,而股票市场的特殊性也决定了股票的分析与预测是数据挖掘技术的一个重要的应用领域,很多学者和公司都在致力于数据挖掘技术在股票分析与预测中的研究与应用。 本文从上市公司财务报表分析入手,通过采用数据挖掘技术的概念和方法,对发行股票的上市公司财务报表进行分析,以预测该公司所发行股票的价格走势情况,主要研究内容包括以下几个方面: (1)分析了核覆盖算法相对其他分类算法的优越性。然后根据搭建的股票价格预测分类模型进行实验,以达到分类预测来年上市公司股票的每股收益的目的,实验结果表明核覆盖算法在样本数量不多的情况下,其预测的正确率不仅远远高于传统的分类算法(例如BP算法),也略高于SVM(Support Vector Machine)的预测正确率,证明了核覆盖算法在股票分类预测中的适用性,从而为股票预测提供了一种新的解决方法和思路。 (2)通过聚类分析综合众多上市公司的多项数据指标,对于公司的盈利能力和水平能够较真实地反映,并且从中挖掘出具有实用价值的数据信息,根据综合的数据对上市公司的前景进行较准确的预测,实验结果也表明聚类算法克服了股票市场的复杂性,将具有相同变化趋势的股票聚在一起,取得了良好的聚类效果,也进一步证明了数据挖掘技术可以从股票市场大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识,以对股票的每股收益作出更为准确的预测。