论文部分内容阅读
投资组合的构建与选择问题是计量金融的基础研究问题,也是金融工程中的一项实际工程任务,其目的是优化资产的财富分配。Markowitz于1952年提出资产组合选择的正式模型,第一次从资产的收益率与风险之间的关系出发,引入均值-方差分析,讨论了最优资产组合的选择问题。该模型直到现在仍受到广大投资公司的关注。随着金融数学的问世与计算机科学的不断发展,使得现代金融投资理论开始摆脱纯粹经验化操作和单纯描述性研究的状态,进入了定量分析这一高级阶段,并为投资者进行投资决策提供了指导。当今世界经济飞速发展,金融危机和市场波动频繁出现,我国的资本市场虽然在改革开放之后得到长足发展,但还不太完善和成熟,使得投资者面临越来越多错综复杂的金融投资决策的理论和实践问题,量化理论的发展对投资组合优化问题的研究也越来越具有重要的理论和现实意义。本文将投资组合的选择问题,建模为不确定性条件下投资组合的序列决策问题,将强化学习技术应用于投资组合选择。采用多臂赌博机系列算法中的线性上界置信算法LinUCB(Linear Upper Confidence Bound),将投资组合中的风险度量定义为上界置信区间,根据强化学习算法的在线学习特性,使得模型在实验期不断地迭代过程中,实现与环境的交互,最终实现累积收益的最大化。同时引入决策树算法(Decision Tree),在每期选择前对股票池进行有监督的分类,形成待选则的投资组合。本文将从以下三个方面开展研究工作,一是构建基于软分类的决策树C4.5模型构建,二是基于期望效用函数构建自适应多臂赌博机模型,对投资组合进行序列选择与权重确定,三是投资组合优选模型参数调整与结果比较。结果表明,本文基于期望效用最大化原理,构建的自适应多臂赌博机算法投资组合模型,在实验期间的累计收益率均高于对照组,表明了本方法的有效性。而且通过进一步实验证明,模型在选择投资组合的过程中不断学习,使得算法能越来越了解投资者,因此,当训练数据时间越接近实验期结尾,所构建的投资组合表现越好。