论文部分内容阅读
近年来最优控制问题一直是控制领域研究的热点之一,其主要思路是找到一个最优的控制策略使得由系统状态和控制策略组成的价值函数达到最优。但是现实工业中系统状态难以测得,因此最优输出反馈控制被提出研究。在最优输出反馈控制的研究中,传统的求解方案有离线求解方案和设计状态观测器把输出反馈问题转化为状态反馈进行求解的方案。本文在传统求解方式的基础上,寻找一种只借助于系统输出在线求解最优输出反馈控制方法,摒弃通过设计观测器的求解方案。本文重点介绍了使用数学变换的方法结合数据驱动的理论,将待求代数黎卡提方程变换成利用系统输出求解。此外,为了克服前两种方法的局限性,本文结合了一种状态重构的方法对输出反馈控制问题进行求解,具体研究内容为:针对连续时间线性系统最优输出反馈控制问题,本文首先概述了最优控制问题,介绍了最优控制问题中的状态反馈控制求解方式。同时,介绍了最优输出反馈控制和最优状态反馈控制之间的转换关系。本文第二章使用离线求解的方法求解最优输出反馈控制,离线迭代的方法虽然可以根据系统的构造求解出系统的最优控制器值,但是离线迭代方案不能满足工业生产中的实时性要求。因此,本文第三章提出了在线迭代的方法,把系统的输出整合到根据系统构建出来的ARE方程中去,这种方法中定义系统的增益矩阵和系统增益值为两个不同步的迭代值,在进行迭代的时候需要给增益值一个初始值,才能保证迭代能继续进行。这种求解方法虽然可以满足系统求解的实时性问题,但是因为其分步迭代的原因导致其求解控制器的收敛速度过于缓慢,不能满足工业生产中控制器的快速响应的要求。因此,本文第四章提出了在线自适应求解的方案,利用自适应来求解最优的思路,在进行算法设计的时候,控制系统的增益矩阵和增益值是同步求解的,所以在线自适应学习是一次求解的方法,可以更加快速的求解出控制器,但是这种求解方式需要的系统条件相对严苛,且求解精度较低速度不够快。因此,本文的第五章提出了状态重构的思路,利用系统输出来重新构造出系统的状态,然后利用构造的状态进行最优输出反馈控制问题的求解。为了说明本文研究算法的有效性,分别在本文的第二、第三、第四、及第五章节进行了仿真分析,并在本文的第六章使用三自由度直升机实验平台对本文第三章的理论进行了实验验证,对比PID控制,本文第三章研究算法更加稳定可靠。