论文部分内容阅读
在过去的几十年中,完全耦合的正倒向随机微分方程(FBSDE)和随机最优控制问题的数值计算一直无法真正地进行到高维。直到最近深度学习方法的引入,使得求解高维的FBSDE和随机最优控制问题的数值解得到了突破性的进展。本文主要研究将深度学习方法应用在求解高维的完全耦合的FBSDE、随机最优控制问题、随机哈密顿系统问题、完全耦合的FBSDE驱动的随机最优控制问题和非线性期望理论等随机分析问题的数值计算上。本文的主要创新点在于,利用深度神经网络处理高维数据的能力,将所处理的随机分析问题通过构造合适的神经网络结构来求其数值解。我们对于不同的随机问题,都较为系统地讨论了在深度学习方法下,给出了随机问题的数值计算方法,从问题转化和迭代算法上都给出了新的表述。总的来说,深度学习方法比较好地解决了一类FBSDE和随机最优控制问题的高维计算问题,打破了传统经典方法不能处理高维问题的局限,在高维计算领域得到了突破性进展。文章共有8章,第1章和第2章为绪论和预备知识部分,第3章至第7章是深度学习方法在具体问题中的具体实现,主要内容如下:第1、2章是绪论和预备知识部分。此2章的主旨是为了方便读者更好地理解本文,简要介绍了随机分析理论和深度学习理论的发展历史,回顾了一些相关的基础知识,以及[28]中提出的深度BSDE方法。第3章主要研究的是通过构造合适的深度神经网络结构来求解高维完全耦合的FBSDE问题。在这里,我们将过程Z看作是随机控制,并根据控制Z的不同反馈形式,我们相应构造了三种不同的神经网络结构,系统地讨论了在不同状态反馈函数情况下,求解FBSDE的深度学习方法。另外,我们还给出了在不同条件下,深度学习方法的收敛性证明。第4章主要探讨的是如何通过计算由随机最大值原理(SMP)得到的随机哈密顿问题,来求解高维的随机最优控制问题。由随机最优控制问题导出的随机哈密顿系统,实际上是一个带有最大值条件的完全耦合的FBSDE,这一章便是根据最大值条件的不同性质,构造相应的神经网络结构来求解该随机哈密顿系统。通过随机哈密顿系统来求解随机最优控制的主要优势在于,它给出了一个判定数值解是否足够接近显式解的一个标准,那就是看损失误差是否接近于0.第5章主要讨论的是一种全新的计算随机哈密顿系统的深度学习方法。对于随机哈密顿系统,我们首先去寻找它所对应的随机最优控制问题,使得该随机最优控制问题通过SMP得到的随机哈密顿系统便是我们最初要求的随机哈密顿系统。根据随机哈密顿系统的性质,我们可以将其对应的随机最优控制问题分为两类。一类是该随机最优控制问题是可以显式表达的,另一类是不可以显式表达的。前者是一个经典的随机最优控制问题,后者是一个带有最大化目标的随机最优控制问题。对于后者,我们将其转化为一个随机Stackelberg博弈问题,并提出了一种新的交叉优化方法,对随机最优控制问题和需要最大化的控制问题分别进行交叉优化。第6章讨论的是完全耦合的FBSDE驱动的随机最优控制问题数值解。对于该随机最优控制问题,我们首先将其转化为一个随机Stackelberg博弈问题,并通过交叉优化的方法来计算该博弈问题。其中相比较于领导者的优化问题,我们需要对跟随者的优化问题进行更多次数的迭代计算,保证它优先达到最优。本章还给出了金融市场随机递归效用模型计算的例子,结果表明我们的交叉优化方法对求解完全耦合的FBSDE驱动的随机最优控制问题是收敛的。第7章我们简单探讨深度学习理论在非线性期望计算方面的应用。根据次线性期望的表示定理,一个次线性期望可以表示成一族线性期望的上确界,此时我们可以将次线性期望看作是一个带有控制域约束的随机最优控制问题的最优值函数。那么以上几章中提到的求解随机最优控制问题方法都可以用来计算次线性期望问题,特别是用来计算高维情况下的次线性期望问题。我们计算了6种不同函数下的次线性期望,结果表明,对于凸函数或凹函数,以及值域非负或非正的一般函数,深度学习方法计算次线性期望都有比较好的收敛结果,而对于值域既可以取正、又可以取负的非凸非凹函数,深度学习方法计算出来的结果是发散的。这要求我们需要去寻找更加精准有效的数值计算方法来计算高维的次线性期望问题。最后一章对本文简要做了一个总结,并展望了未来可以讨论的方向。