集成学习方法在上市公司盈利预测中的应用研究

被引量 : 0次 | 上传用户:yufengjin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,预测已经成为一门重要的学科。随着预测科学的发展,非线性预测方法成为当前研究的热点。集成学习方法作为机器学习研究领域的四大主题之一,越来越受到研究者的关注。作为一种相当有效的机器学习方法,集成学习已经广泛地用于公司财务困境、汇率预测及文本挖掘等研究领域。公司的盈利能力是投资者普遍关注的焦点。盈利预测也成了最近许多研究者研究的主题。盈利预测准确与否,关系到广大投资者的切实利益。因此,为了能使预测更加准确,许多预测方法被用于盈利预测中。但是,现有研究采用的方法得到的盈利预测准确率并不高。因此,如何应用新的更为有效的方法来进行预测,是一个迫切需要解决的问题。本文在对有关盈利预测的相关文献进行分析的基础上,指出了现有研究存在的主要问题。在此基础上,本文对集成学习方法用于盈利预测的机理进行了分析。考虑到盈利预测问题是个复杂的非线性问题后,本文运用以决策树和BP神经网络作为基学习器的集成学习方法预测公司未来盈利状况。本文对所建立的集成学习模型进行了实证研究。实证研究选取的数据样本是沪深两市2001年至2007年A股上市公司的年报数据。其中,2007年的数据作为测试样本。在剔除了那些在中途上市或财务变量中含有大量缺失值的公司后,本文对所得到的样本数据进行了预处理,包括缺失值、奇异值的处理。此外,为了使数据符合神经网络方法的要求,本文对其进行了归一化处理。将各财务变量的范围归一到[-1,1]。为了更贴近实际和更好地指导投资者,本文将目标变量(每股收益)划分为三类。利用选取的财务变量和目标变量的数据集训练得到作为集成学习基学习器的决策树模型和神经网络模型后,本文分别用决策树集成学习方法和神经网络集成方法预测了上市公司在2007年时的盈利状况。结果表明,两种集成学习方法的预测结果都比单个决策树或者神经网络模型的稳定性好。
其他文献
植物园肩负着植物多样性保护的重任,并以植物展示的形式向大众进行科普教育。数字植物园是在数字地球发展的大环境下提出来的,数字植物园的建立提高了植物园管理水平与服务质
城市绿地是城市中一种特殊的生态系统,它是城市系统中能够执行“吐故纳新”负反馈调节机制的子系统。城市绿地是城市可持续发展的重要基础之一,科学合理的城市绿地景观布局能
20世纪末以来,我国高校的不断扩招及高校收费制度的全面实行,虽积极推动了我国高等教育事业的发展,但与此同时,经济困难学生就学难问题也日趋突出。在此背景下,我国于1999年
DC-DC开关变换器的建模分析是研究开关电源的基础,对开关电源的分析与设计具有重要意义。本文对DC-DC开关变换器的建模分析进行了深入的研究,有助于开关电源的性能优化和设计
目的:研究年龄、性别、分期、LDH、β2-MG、IPI及骨髓侵犯情况在弥漫性大B细胞淋巴瘤中的临床意义。方法:回顾分析2004年1月至2008年10月期间我院收治的107例初发弥漫性大B细
真核生物和原核生物在高温、接触毒物和其它各种应激因素〔如高温、紫外线、PAHs(polycyclic aromatic hydrocarbon)、重金属等〕有害因素作用时,生物体会迅速启动高度程序化
本文通过对参加2007年中国全明星啦啦队锦标赛暨2008年世界啦啦队锦标赛选拔赛的部分参赛队伍进行调查分析,分析该运动项目的发展现状,对其技术性方向进行展望,为我国舞蹈啦
公共电视在当今社会发展中是一种不可或缺的媒介形态,它不以营利为目的,以服务公共为宗旨,具有公益性、普适性、多元化和独立性等特点。世界上的公共电视大致可以分为欧洲体
狮子山矿田是安徽铜陵矿集区内最具代表性的大型铜金矿田,目前已探明铜矿床和金矿床等大中小型矿床数十处,达到大型-超大型规模。以往研究成果众多,然而关于其成矿物质来源和
翻译教学的最终目标是提高学生译者的翻译能力,培养高素质的翻译人才,适应市场经济的需求。因此,研究翻译教学应该建立在研究学生译者翻译能力的基础之上。本研究首先从广义