带约束的随机递归最优控制问题的全局最大值原理

来源 :山东大学 | 被引量 : 0次 | 上传用户:yushion
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Pontryagiin及其团队[1]在二十世纪五十年代首次提出了确定性最优控制系统的最大值原理,但因为随机积分的存在该原理不能平行推广到随机最优控制系统中,Peng[5]通过对变分进行二阶泰勒展开得到经典的随机最大值原理。Duffie和Epstein[11]引入了连续时间下递归效用的概念,之后,有很多学者研究了随机递归最优控制系统的局部最大值原理。然而,全局最大值原理却未得到解决,Peng[21]提出如下公开问题:“当函数f非线性依赖于z时的全局最大值原理是公开问题”。该公开问题的主要难点是状态变量的二阶变分方程和二阶伴随方程未知。最终,Hu[26]通过引入两个新的伴随方程克服了这两个难点,并得到随机递归最优控制系统的全局最大值原理。本文主要研究带约束的随机递归最优控制系统的全局最大值原理,将Yong和Zhou[27]中的约束条件拓展到带递归效用的情况就是本文所要求的约束条件。本文主要分为两个部分:第一部分,研究一维情况的带约束的随机递归最优控制系统的全局最大值原理。考虑由随机微分方程和倒向随机微分方程y(t)= Φ(x(T))+ f(s,x(s),y(s),z(s),u(s))ds-z(s)dW(s),共同描述的随机递归最优控制系统,其中,定义代价泛函为J(u·))= y(0).同时,要求状态过程满足如下状态约束:Eh(x(T),y(0))+ E ∫0T g(t,x(t),y(t),z(t),u(t))dt ∈ T,(?)其中,h和g均为给定函数。该问题可以描述为在可行控制集u[0,T]上最小化上述代价泛函。即存在一个最优控制u(·)使得下式成立:本文的研究目标是获得最优控制u(·)满足的必要条件。在推导最大值原理的过程中,首先定义惩罚代价泛函,然后利用针状变分、Ekeland变分原理和泰勒展开,之后引入两个新的倒向随机微分方程和一个新的随机微分方程,其适应解分别为(p0(.),q0(.)),(P0(.),Q0(.))和γ(·),随后利用Ito公式,并介绍一个哈密尔顿函数来得到变分不等式,最后通过取极限得到一维情况的带约束的随机递归最大值原理和横截条件。本文的创新就在于引入这三个新方程,使得上述约束条件下的随机递归最大值原理得以解决。另外,在h和g同时等于零,且Γ为全集Rl的情况下,也就是说,并没有受到状态约束的束缚,经过推导可以得到本文所得到的最大值原理与Hu[26]中的无约束情况的最大值原理相同。第二部分,研究多维情况的带约束的随机递归最优控制系统的全局最大值原理。首先,将状态过程(x(.),y(.),z(.))及其满足的微分方程推广到高维情况,代价泛函会变为y的复合函数形式,即J(u(.))=H(y(0)),相应地,约束条件会变为如下形式:Eh(x(T),H(y(0)))+ E ∫0T g(t,x(t),y(t),z(t),u(t))dt ∈T.与一维情况的定理推导过程大致相同,不同的是泰勒展开时需考虑y的复合导函数Hy(y(0)),所以一维情况中新引入的三个微分方程在推广到高维情况后也会做出相应的一些变化。同时,也需要引入高维的哈密尔顿函数来得到多维情况的带约束的随机递归最优控制系统的全局最大值原理。当各个维度都为一时,即多维情况回归到一维情况,本文得到的两个定理将有相同的结论。同样,本文得到的多维情况的带约束的随机递归最大值原理经过推导也可以缩减为Hu[26]中多维情况的无约束最大值原理。
其他文献
本文通过对浆细胞性乳腺炎病因病机的再认识,提出了温阳托毒是治疗本病的重要方法。
舞蹈艺术具有一定的时间性及综合性,是一种动态造型艺术。相对而言,其发展主要是外部因素及内部因素决定的。外部因素主要是与舞蹈发展具有联系的一些影响性因素,内部因素主
随着塑料工业的飞速发展,塑料产品依靠其优良的加工性能及使用性能已经在汽车、家电、物流、医疗器械、航空航天等领域得到了广泛的应用,并逐步呈现出“以塑代钢”、“以塑代
内部审计对于提升整个企业的核心竞争力有着不可替代的作用。随着社会主义市场经济体制的推进与完善,带动了一批产业诸如文化业的飞速发展。内部审计无论是在深度还是广度方
[目的]选育具有耐温特性的醋酸菌,用于醋酸发酵。[方法]从醋醅中筛选具有较好耐温特性的醋酸菌,并且通过常温等离子体诱变提高该菌株的发酵效率。[结果]从山西老陈醋醋醅中筛
提出基于dbN小波算子小波变换分解行星齿轮故障特征的故障检测算法,算法可以在轻微损坏时就较好地判断出齿轮故障。通过分析行星齿轮的故障成型,以及故障的冲击振动传播路径,
热水沉积成矿作用是近代成矿理论的重大发现,热水沉积的矿床有着规模大,品位高的特点。本文依据前人研究成果,阐述了热水沉积矿床地质地球化学研究进展,存在问题与发展趋势。
现代大学校园景观规划设计对于提高高校整体形象,丰富校园文化及促进学生德智体全面发展具有重要意义。本文针对校园景观规划设计的特点,并结合实例阐述了大学校园景观规划设
近年来,城市居民社区参与现状堪忧,表现出参与主体失衡、参与广度和深度有限、参与机制不健全、居民参与潜能欠开发等问题,已成为社区建设深入推进的瓶颈。本文基于对深圳X社
高速公路施工管理工作的科学化、合理化进行旨在促使工程项目建设实现高水平的质量管理效益和成本控制经济效益,以此最优化促使工程项目建设满足现代化高速公路施工管理体系,