深度学习方法求解高维正倒向随机微分方程和随机最优控制问题

来源 :山东大学 | 被引量 : 0次 | 上传用户:wffgwffg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去的几十年中,完全耦合的正倒向随机微分方程(FBSDE)和随机最优控制问题的数值计算一直无法真正地进行到高维。直到最近深度学习方法的引入,使得求解高维的FBSDE和随机最优控制问题的数值解得到了突破性的进展。本文主要研究将深度学习方法应用在求解高维的完全耦合的FBSDE、随机最优控制问题、随机哈密顿系统问题、完全耦合的FBSDE驱动的随机最优控制问题和非线性期望理论等随机分析问题的数值计算上。本文的主要创新点在于,利用深度神经网络处理高维数据的能力,将所处理的随机分析问题通过构造合适的神经网络结构来求其数值解。我们对于不同的随机问题,都较为系统地讨论了在深度学习方法下,给出了随机问题的数值计算方法,从问题转化和迭代算法上都给出了新的表述。总的来说,深度学习方法比较好地解决了一类FBSDE和随机最优控制问题的高维计算问题,打破了传统经典方法不能处理高维问题的局限,在高维计算领域得到了突破性进展。文章共有8章,第1章和第2章为绪论和预备知识部分,第3章至第7章是深度学习方法在具体问题中的具体实现,主要内容如下:第1、2章是绪论和预备知识部分。此2章的主旨是为了方便读者更好地理解本文,简要介绍了随机分析理论和深度学习理论的发展历史,回顾了一些相关的基础知识,以及[28]中提出的深度BSDE方法。第3章主要研究的是通过构造合适的深度神经网络结构来求解高维完全耦合的FBSDE问题。在这里,我们将过程Z看作是随机控制,并根据控制Z的不同反馈形式,我们相应构造了三种不同的神经网络结构,系统地讨论了在不同状态反馈函数情况下,求解FBSDE的深度学习方法。另外,我们还给出了在不同条件下,深度学习方法的收敛性证明。第4章主要探讨的是如何通过计算由随机最大值原理(SMP)得到的随机哈密顿问题,来求解高维的随机最优控制问题。由随机最优控制问题导出的随机哈密顿系统,实际上是一个带有最大值条件的完全耦合的FBSDE,这一章便是根据最大值条件的不同性质,构造相应的神经网络结构来求解该随机哈密顿系统。通过随机哈密顿系统来求解随机最优控制的主要优势在于,它给出了一个判定数值解是否足够接近显式解的一个标准,那就是看损失误差是否接近于0.第5章主要讨论的是一种全新的计算随机哈密顿系统的深度学习方法。对于随机哈密顿系统,我们首先去寻找它所对应的随机最优控制问题,使得该随机最优控制问题通过SMP得到的随机哈密顿系统便是我们最初要求的随机哈密顿系统。根据随机哈密顿系统的性质,我们可以将其对应的随机最优控制问题分为两类。一类是该随机最优控制问题是可以显式表达的,另一类是不可以显式表达的。前者是一个经典的随机最优控制问题,后者是一个带有最大化目标的随机最优控制问题。对于后者,我们将其转化为一个随机Stackelberg博弈问题,并提出了一种新的交叉优化方法,对随机最优控制问题和需要最大化的控制问题分别进行交叉优化。第6章讨论的是完全耦合的FBSDE驱动的随机最优控制问题数值解。对于该随机最优控制问题,我们首先将其转化为一个随机Stackelberg博弈问题,并通过交叉优化的方法来计算该博弈问题。其中相比较于领导者的优化问题,我们需要对跟随者的优化问题进行更多次数的迭代计算,保证它优先达到最优。本章还给出了金融市场随机递归效用模型计算的例子,结果表明我们的交叉优化方法对求解完全耦合的FBSDE驱动的随机最优控制问题是收敛的。第7章我们简单探讨深度学习理论在非线性期望计算方面的应用。根据次线性期望的表示定理,一个次线性期望可以表示成一族线性期望的上确界,此时我们可以将次线性期望看作是一个带有控制域约束的随机最优控制问题的最优值函数。那么以上几章中提到的求解随机最优控制问题方法都可以用来计算次线性期望问题,特别是用来计算高维情况下的次线性期望问题。我们计算了6种不同函数下的次线性期望,结果表明,对于凸函数或凹函数,以及值域非负或非正的一般函数,深度学习方法计算次线性期望都有比较好的收敛结果,而对于值域既可以取正、又可以取负的非凸非凹函数,深度学习方法计算出来的结果是发散的。这要求我们需要去寻找更加精准有效的数值计算方法来计算高维的次线性期望问题。最后一章对本文简要做了一个总结,并展望了未来可以讨论的方向。
其他文献
通过北大仓白酒灌胃建立大鼠慢性酒精中毒脑损伤模型,研究玉米肽对酒精性脑损伤的保护作用。SD大鼠随机分为 7 组,正常对照组、慢性酒精性脑损伤模型组、125、250、500、1000、2000 mg/kg玉米肽实验组。造模结束后取脑组织进行病理组织学观察,同时采用酶联免疫试剂盒检测各组大鼠脑组织中氧化应激、炎性因子、部分神经递质及其它等相关指标。结果表明酒精可使脑组织神经细胞发生病理性改变,玉米肽干
高校教学楼公共活动空间是高校校园建设的重要部分,是师生学习和交流的重要场所。近年来,高校教学楼公共活动空间的人性化设计越来越受到重视。文章探讨了高校教学楼公共活动空间的重要性,研究了高校教学楼公共活动空间的特点和主要类型,总结了高校教学楼公共活动空间的人性化设计原则。
本文通过对文献进行分析和归纳,将明胶改性水凝胶在骨再生与修复中的应用分为3类,细胞疗法、蛋白质疗法和人工材料疗法。基于明胶改性水凝胶在骨缺损的再生与修复中的应用,通常可按以下步骤进行:首先在明胶中通过特定方式加入无机成分制备仿生材料支架,使其结构、力学和生物学等特性与天然骨组织相似,并具有成骨性;再通过将支架与种子进行复合(也可不复合),经相关生物学特性检测证实,基于明胶改性水凝胶有利于细胞的增殖
面对复杂的国内外经济形势,"十四五"时期乃至今后更长一段时间内,经济高质量发展必须主动适应以国内大循环为主体、国内国外双循环相互促进的新发展格局,促进形成强大国内市场,优化营商环境;实现消费体系升级;大力推进科技创新;全面提高对外开放水平;推动共建"一带一路"高质量发展;推动人民币国际化战略;推动经济高质量发展,实现我国经济社会发展长期向好的目标。
近年来BIM技术已在工程项目各领域中广泛应用,但在工程造价中应用不多。本次研究主要选取典型工程项目进行BIM建模,并将BIM模型的创建与造价工程量计算相结合,根据工程量计算规则设定建模工作中结构构件的相关数据,使建立的BIM模型能够导出所需的工程量。通过此方法,造价人员可以直接根据BIM模型导出工程量或借助相关BIM算量软件得出计价文件,使BIM技术与工程造价联系起来,提升了造价工作的效率,提高了
中国西南部哀牢山成矿带南段长安金矿床成因机制仍然有待研究,为了解其成矿物质与流体来源,掌握其矿床成因类型,给矿山找矿增储工作提供依据,本文以长安金矿床作为研究对象,通过详细的地质特征描述、流体包裹体测温学和矿石H-O-S-Pb同位素测试来研究成矿物质和流体来源、演化,进而制约矿床成因,建立成矿模式。研究结果表明:前人认为的近南北向构造F6并非断裂构造,而是隐爆角砾岩筒,其为长安金矿床的主容矿构造;
<正>作业是学生深化知识理解的重要途径,发挥作业的价值可以提升学生的学习能力,促进学生的思维发展。“双减”政策对学生的作业量做出了详细规定,使得广大语文教师不得不基于大单元教学理念进行作业设计,以提高作业质量,强化学生的学习效果。一、小学语文作业设计存在的问题1.设计作业时没有融入大单元教学思想大单元教学是一种教学思想,而单元教学是一种教学设计规划,两者有联系也有差别。部分教师在设计作业时容易把单
期刊
以企业转型升级为时代背景,结合新工科人才培养特点,通过对吉林省内三家企业的走访调查,制定了适应性人才岗位胜利力模型,并以此为目标,提出了快速适应性人才培养模式,包括:以企业需求为导向的专业课程设置、以实际问题为目标的实战技能培养、以虚实结合为手段的能力建设、以“双师型”为模式的教师团队建设。通过跟踪调查结果,验证了适应性人才培养模式的效果。
报纸
藜蒿(Artemisia selengensis Turcz)作为菊科(Asteraceae Bercht.)蒿属(Artemisia)多年生草本植物,习称蒌蒿、芦蒿、水蒿等,是我国非常传统的一种既可药用也能食用的保健蔬菜,藜蒿其全草可入药,主要是其富含蛋白、膳食纤维、以及黄酮类化合物、多糖、酚酸等多种活性成分,而这些活性成分具有抗炎、抗菌、延缓衰老以及预防各类疾病等作用,具有非常高的的营养价值以