论文部分内容阅读
马尔可夫跳变系统是一类具有马尔可夫参数的随机混合系统,其动态演化由连续时间和离散事件共同描述,离散事件被称为系统模态,并且该系统在各个模态的随机跳变由马尔可夫过程控制。在实际中,马尔可夫跳变系统能够有效建模内部结构易受到环境突变、设备故障、连接失败等影响而发生突变的动态系统,并取得重大成功,引起学者不断关注。因而,研究马尔可夫跳变系统具有深远的理论和实际意义。 马尔可夫跳变系统不同模态间随机切换规律由马尔可夫链描述。在连续时间马尔可夫跳变系统中,切换概率由模态转移速率矩阵(MTRM)决定,而离散时间马尔可夫跳变系统则由模态转移概率矩阵(MTPM)决定。大量文献表明马尔可夫跳变系统其性能与MTRM、MTPM关系密切,并且其中绝大多数研究基于MTRM、MTPM为定值的情况。然而真实系统中,MTRM和MTPM往往是可控的,且人为控制MTRM、MTPM能够改善动态系统的稳定性和性能。另外,马尔可夫跳变系统常用于建模多噪声系统,因此噪声也是不可忽略的因素。值得注意的是,噪声不仅会干扰系统状态,而且会对系统性能产生不利影响。本文针对马尔可夫链可控的马尔可夫跳变系统,研究高斯噪声存在下系统性能的优化策略。根据系统状态和系统模态的不同,分别研究连续时间马尔可夫跳变系统和离散时间马尔可夫跳变系统的优化策略。具体工作如下: (1)针对高斯噪声下可控MTRM的连续时间马尔可夫跳变系统,研究了系统性能的决策-控制策略,其中决策代表对MTRM的控制,控制则表示状态控制器。对于上述决策-控制策略,提出包含跳变线性二次高斯最优控制的代价和决策代价的混合性能指标。假设最优决策已引入MTRM,利用分离定理分别设计最优状态反馈控制器和最优马尔可夫滤波器,将设计最优决策-控制对简化为寻找最优决策。最后提出一个能够寻找最优决策量的迭代算法,并进一步证明其收敛性和存在性。 (2)针对高斯噪声下MTPM可控的离散时间马尔可夫跳变系统,研究系统性能的优化策略。基于能控的MTPM,提出了一种决策-控制策略。由于决策的引入不可避免产生额外控制代价,因此本文引入一种混合性能指标。假设最优决策已引入MTPM,利用分离定理设计了最优控制器,将混合性能指标转化为决策量的函数。为了最小化混合性能指标,本文进一步提出了一个寻找最优决策量的迭代算法。 本文给出了基于高斯噪声和可控MTRM/MTPM的马尔可夫跳变系统决策-控制策略,从理论上给出了相关控制器的设计方案,并通过仿真实验验证了决策-控制策略的有效性。论文结尾,给出了研究总结,并讨论了下一步的研究方向。