论文部分内容阅读
本文主要研究了混合动态时变系统在有限时间域上的最优控制理论及其应用问题。本文首先分别考虑了有限时间混合动态时变系统在终端自由和终端约束两种情形下的最优控制问题,得到了最优控制问题的解在这两种情形下分别是一类拟变分不等式的唯一的粘性解和唯一的下半连续解的结论,并给出了它们之间的关系。随后对于实际存货系统建立了一个统一的混合动态模型,并将前面所得到的理论结果应用到生产存货系统中的一个具体实例中,得到了最优切换控制问题的解以及相应的最优切换律。本文的最后还讨论了非线性边界抛物型方程在三维柱坐标系下的能控性问题。全文包括有以下七章。第一章介绍了混合动态系统及其研究背景,简单描述了混合动态系统的数学模型,并从最大值原理和动态规划两个方面回顾了关于混合动态系统的最优控制问题的研究现状以及存在的问题。最后对于本文的主要工作做了简要说明。第二章研究了一类有限时间终端自由的切换时变系统的最优控制问题,讨论了值函数的性质,得到了切换问题的最优化条件,并给出了建立最优切换律的策略,最后对于最优切换问题的值函数是一类拟变分不等式的唯一的连续粘性解的结论给出了新的严格详尽的证明。这一章的内容也是为下文关于混合动态系统终端受到约束的情形奠定了必要的理论基础,并且在这一章中采用的方法以及得到的结论和下文中所采用的方法以及得到的结论可以形成更清晰的对比。第三章研究了一类有限时间内终端受到约束的切换时变系统的最优控制问题。终端约束的出现使得最优控制问题的值函数不仅仅不是连续可微的,甚至是不连续的。因此,以往关于拟变分不等式的粘性解的讨论中所使用的方法也就不再适用,需要利用新的方法将粘性解延展到半连续函数中。本文首次将生存理论这一数学工具应用到有限时间切换时变系统的最优控制问题中,得到了最优控制问题的值函数是一类拟变分不等式唯一的下半连续解的重要结论。值得注意的是,本章的证明中去除了以往文献[57,58]中关于切换费用通常所做的三角不等式的假设,而只保留了严格大于零的假设条件。在这一章的最后在对值函数附加了一定的假设条件后还进一步地得到了最优切换控制问题的值函数是这类拟变分不等式粘性解的结论。第四章研究了一类同时包含有两类离散事件,即状态跳变和系统切换的混合动态时变系统在终端受到约束时的最优控制问题。这类系统的最优控制问题比起第三章的最优切换问题更为复杂。本文首次将生存理论应用到这一复杂系统的最优控制问题中来,得到了最优控制问题中的值函数是一类拟变分不等式唯一的下半连续解的重要结论。在这一章中同样把以前文献[3][57,58]中常用的关于切换费用和跳变费用的三角不等式的假设条件都予去除。而且在这一章中,比[68]和第三章更进一步地讨论了这类拟变分不等式的下半连续解与拟变分不等式的粘性解之间的关系。第五章从实际的库存系统的优化管理中提出一个数学问题,即是我们对于存货系统应该建立一个怎样的数学模型使得这一模型能够全面而真实的描述出一个实际存货系统的变化。在这一章中对以往的关于存货系统的数学模型进行了回顾,并建立了一个新的模型。这一模型中不仅含有驱动系统演化的连续变量,也有驱动系统演化的离散事件。而且这一新的模型不仅可以刻划存货系统中出现的各种离散现象,还可以包容以前关于存货系统建立的各种数学模型。因为这一模型的高度包容性,我们称之为存货系统的统一的混合动态模型。这一章也为第六章的内容做了必要的铺垫。第六章的主要目的是要将前面第三章中关于切换系统的理论成果和应用问题联系起来,通过一个生产存货系统的具体实例说明这些复杂艰深的数学理论的实用性。在这一章中并没有对H-J-B方程进行直接计算,而是首先提出了候选值函数,通过计算候选值函数的邻近次微分,并且验证其是否满足拟变分不等式下半连续解的定义,由此证明了这一候选值函数确实是最优切换问题的值函数,从而得到了与之相对应的最优切换策略。这一求解途径和以前关于切换系统最优控制问题的应用方面所取得成果都是不同的,而且在这一章中的最优切换问题的切换序列是未知的。本文的第七章研究了柱坐标系下的三维热传导方程的非线性边界控制系统的能控性问题。这类非线性系统中的非线性项只满足局部Lipschitz条件,于是采用了阶梯函数的方法,对于热传导方程的逼近能控性进行了讨论,得到了线性系统的逼近能控性,并给出了控制的显式表达,而在文献[103]中控制的具体求法是未知的。在这一章的最后,利用线性系统的结果得到了非线性边界控制系统的逼近能控性。