论文部分内容阅读
近些年来,人们逐渐认识到现实世界中的一些问题的发展不仅依赖于当前的状态,而且还依赖于其过去的历史。这类问题应该用状态对过去有依赖的系统方程来刻画,我们称之为随机微分延迟方程(简记为SDDE).由于其在工程、生命科学及金融等领域的广泛应用(可参见[3;11;43;44;47;33]等),SDDE成为现代研究的热点问题。本文将致力于在金融及其他领域中常见的受控的延迟系统的研究。对于一个系统而言,当观测与调控之间有时间差或者控制有滞后性时就会出现系统延迟,我们称之为时滞系统。2000年,(?)ksendal和Sulem[47]研究了一类财富方程为SDDE的最优控制问题。在他们的模型中,不仅当前值X(t)而且X(t-δ)及过去值在某种意义下的平均值都会影响t时刻财富的增长。由于所选模型的特殊性,他们能够将无穷维问题化为有限维问题来处理,得到了问题的最大值原理,并将结果应用于金融中的相关问题。但是他们的条件,相对来说,是比较强的。在实际当中,观测过去的数据可能是离散的有限个点,因此我们首先考虑当前发展依赖于以往有限个点的系统,而且控制也具有延迟性,这些延迟还可以是时变的。我们研究一类时滞系统的最优控制问题,其中状态及控制变量都有延迟。在相对比较一般的条件下,我们得到了这类受控的时滞系统的最大值原理。作为应用,我们用得到的结果处理了经济当中一类带有时滞的生产消费选择问题,并得到了问题的显示解。借助于数值计算,我们给出了不同的延迟时间对结果的影响情况。我们的主要创新在于引入新型的倒向随机微分方程(简称BSDE)一超前BSDE(参见Peng,Yang[55])作为伴随方程来处理时滞最优控制问题。据我们所知,这是首次采用这种方法来研究时滞控制系统的最优控制问题。我们也考虑了具有时变延迟的正倒向系统,即用递归效用函数代替一般的效用函数且延迟δ不在是常数,而是时间t的函数。这部分结果推广了1995年Xu[65]中的结论。Hu,Peng[29],Peng,wu[54]和Yong[69]等相继研究了完全耦合的正倒向随机微分方程(简称FBSDE).在处理线性二次(LQ)问题(参见[62;67])和金融中的大户投资问题(参见Cvitanic和Ma[15])时都会遇到这类方程。而我们在探索时滞系统的最大值原理问题时遇到了一类新型的FBSDE,其正向方程为时滞随机微分方程,倒向方程为超前倒向随机微分方程.我们称其为推广的FBSDE,并给出了这类新型FBSDE解的存在唯一性条件.早在1973年Kolmanovskii and Maizenberg就讨论了时滞随机系统的LQ问题。我们在此基础上考虑状态与控制都有延迟的LQ问题,并且用FBSDE和值函数两种方法来寻找最优反馈控制。另外,我们也将关于推广的FBSDE的结果应用于时滞线性二次非零和随机微分对策问题。考虑一般情况,我们处理一类由随机泛函微分方程(简称SFDE)刻画的时滞系统的递归最优控制问题,其中系统及递归效用函数的变动都依赖于过去的一段状态而不仅仅是有限个点。对此类问题,我们证明了其值函数仍满足Bellman型的动态规划原理。由于对过去状态依赖形式的复杂性,完整形式的Ito公式和Dynkin公式都很难得到,故想进一步得到值函数满足的Hamilton-Jacobi-Bellman方程并不是件容易的事情。为此我们引入Mohammed [44]中提到的弱无穷小生成元及Fuhrman等[24]中用到的联合二次变差作为工具,得到了上述问题值函数对应的一个无穷维的HJB方程。而且我们也证明了值函数就是这个无穷维偏微分方程的粘性解。最后,作为理论的应用,我们考虑一类具有延迟效用的广告问题即广告费用支出与产生效果之间会有一定的时间差。Gozzi和Marinelli在[26]中用动态规划原理的方法讨论过这类问题。我们采用与他们不同的方法-无穷维最大值原理来处理这类问题,这种方法是由Hu和Peng[28]首次提出的。这部分结果也是我们论文2.3部分在无穷维空间中的一个推广本论文由5章内容组成,下面我们将列出主要结果。第1章:介绍第2章-第5章所要研究的问题。第2章:我们研究状态方程为如下形式的时滞系统的最优控制问题:首先我们给出此类SDDE解的存在唯一性。接着我们考虑控制域为凸集时的情形,得到了如下的最大值原理。定理2.2.6.令u(·)为时滞随机最优控制问题(2.3)-(2.5)的最优控制,X(·)为其相应的最优轨线。则我们有如下论断:其中对任意0≤t≤T.Hamilton函数定义为:(p(·),z(·))为如下超前BSDE的解更进一步,我们可以得到如下的控制最优的充分条件.定理2.2.8.假设u(·)∈A,令X(·)为其相应的轨线,p(t)和z(t)为伴随方程(2.12)的解。如果(H2.5)-(H2.6)及(2.13)(或(2.16))成立,则u(·)为时滞控制问题(2.3)-(2.5)的最优解。利用得到的最大值原理,我们研究了一类时滞的生产消费选择最优化问题.生产资本x(t)满足如下方程:问题是如何选取消费率c(t)最大化代价泛函下面的命题给出了最有控制问题的显示解,而且从Figure 1和Figure 2中我们可以看出不同的时间延迟对结果的影响情况。命题2.2.9.对生产消费选择问题(2.17)-(2.18),最优消费率为c*(t)=(?),其中p(t)如式(2.20)中的形式。接着,我们考虑了控制域非凸时的递归最优控制问题。假设延迟是时变的,且扩散项σ不含控制,即系统由如下的时滞正倒向方程来描述:定理2.3.6.假设u(·)为最优控制,(x(·),y(·),z(·))为其相应的最优轨线。则对所有0≤t<T,我们有这里k(s)为s=t-ζ(t)的反函数且Hamilton函数H由(2.34)式定义。第3章:我们考虑时滞最优化问题中遇到的一类推广的FBSDE:定理3.1.3.若(H3.1)及(H3.2)成立,则推广的FBSDE (3.1)有唯一适应解(X,Y,Z).我们研究了两类时滞LQ问题,寻找它们的最优控制的显示形式。在问题3.1中,我们假设只有状态有延迟。借助于FBSDE的结果,我们有定理3.2.1.控制为问题3.1的唯一最优控制,其中(χt,yt,zt)为如下的推广的FBSDE的解第二种情况,即问题3.2,我们假设系统的状态及控制都有延迟。通过一类更为复杂的FBSDE我们给出其最优控制的形式。定理3.2.2.控制为问题3.2的唯一最优控制,其中(x(t),y(t),z(t))为推广的FBSDE (3.14)的解。我们引入两种方法来寻找最优反馈控制。这两种方法是从解决最优控制问题的经典方法-最大值原理和动态规划原理这两个不同的角度出发的。从最大值原理的角度出发,我们有:定理3.3.1.假设存在矩阵值过程(Kt,Ht),t∈[0,T],满足广义的矩阵Riccati方程(3.19).则时滞线性二次最优控制问题问题3.3的最优反馈控制为且最优值函数为从动态规划原理的角度出发,我们有:定理3.3.3.设(3.25)中引入的满足如下带边值条件的方程组:对任意t∈[0,T]及θ,ζ∈[-δ,0],则对问题3.4,为[s,T](s≥δ)上的最优控制且值函数为在第3章的最后,我们讨论时滞线性二次非零和随机微分对策问题。定理3.4.1.当且仅当(u1(·),u2(·))具有如下形式时,(u1(·),u2(·))为对策问题Problem 3.5的一个Nash均衡点。其中为推广的FBSDE(3.29)的解。第4章:我们给出了由如下SFDE刻画的时滞系统的递归最优控制问题的动态规划原理:定理4.2.10.若A4.4-A4.8成立,则(4.9)式定义的时滞最优控制问题的值函数u(s,φ)具有如下的优良性质:对任意0≤(?)≤T-s,(?)我们得到了值函数满足的HJB方程—一类无穷维的偏微分方程。定理4.3.9.如果假设我们问题中的值函数则u(s,φ)为如下的Hamilton-Jacobi-Bellman偏微分方程的解:这里我们以▽0u(t,x)记▽xu(t,x)({0}).我们有:定理4.3.11.如(4.9)式定义的u(s,φ)为HJB方程(4.33)的一个粘性解。第5章:在最后一章,我们研究一类广告模型中的时滞随机控制问题作为我们理论的应用。这类时滞的广告模型可以重新定义于Hilbert空间。我们利用无穷维的最大值原理处理该类问题:定理5.3.1.Let(u(·),X(·),Y(·),Z(·))为问题5.1的最优控制及相应的轨线。则如下的最大值原理成立:其中(p(·),q(·),k(·))为如下伴随方程的解这里A是一个强连续半群的无穷小算子,A*为它的伴随算子。若给定某些效用函数我们可以给出最优控制的显示形式。