论文部分内容阅读
基于统计学习理论和结构风险最小化原理的支持向量机,由于解决了过学习、非线性、维数灾、局部极小点等问题,成为目前最普遍使用的机器学习算法。本文对支持向量机回归模型、算法及其在投资决策中的应用进行了研究和探讨,通过建立不同的支持向量机回归模型,给出基于该模型的算法,以提高模型的预测性能,缩短运算时间,并将支持向量机回归模型应用到投资决策问题中,为决策者提供参考。本文的主要工作和结论如下:
给出基于训练数据的模型选择方法。利用训练数据直接给出模型参数的近似值,该近似值可以作为其它模型选择方法的计算初始点。给出基于最小泛化误差界的模型选择方法。通过最小化模型泛化误差的上界,使得选择的模型参数具有好的泛化性能。
给出输入数据的稀疏处理方法。利用数据之间韵相似性除去部分数据,在支持向量回归运算前获得稀疏的训练样本。利用变权迭代最小方差算法,讨论了基于不同损失函数的稀疏支持向量机回归方法。该方法与稀疏LS-SVR方法相比,具有适合处理不同噪声数据,预测性能稳定,泛化性能强等优点。
利用变权迭代最小方差算法,给出基于不同损失函数的多输出支持向量机回归算法。该算法可用来处理含不同噪声的多维输入、多维输出数据的回归估计,对于多维输出数据的回归,使用多输出支持向量机回归算法在预测性能和计算时间上要优于使用多个一维输出的支持向量机回归算法。提出一种多分段的可微损失函数,并给出基于该损失函数的多输出支持向量回归算法。最后对多输出支持向量回归算法的收敛性进行了分析。
分别利用梯度下降法和牛顿法,最小化预测结果的带正则项的即时风险,获得回归函数权系数和偏置的迭代公式,从而给出多输出支持向量机回归的在线算法,实现对动态到达、多输入多输出数据的回归估计。在线多输出支持向量机回归算法比单输出AOSVR算法、BP神经网络算法、批学习的SVR算法等有更快的运算速度,适合于在线多输出数据的回归估计。最后给出了在线MSVR算法的收敛性分析。
利用多输出支持向量机回归算法进行金融时间序列预测,有效地拟合金融数据之间的非线性关系,解决金融数据由于其随机性、非线性、小样本、强噪声,以及多输出之间的相关性而难以预测的问题。
利用多输出支持向量机回归方法进行投资决策的变量选择,通过改变输入变量的分量,分析其对预测输出的敏感性,实现对投资决策变量进行重要性排序,完成变量选择过程。利用支持向量回归方法进行收益率向量的概率密度函数估计,将估计的结果应用到均值、方差投资组合中,进行最优投资组合估计。用SVR还可以直接估计样本与投资组合之间的函数关系。
利用在线多输出支持向量机回归算法,通过预测未来的收益率向量给出计算最优投资组合的步骤。