论文部分内容阅读
自适应动态规划(ADP),作为最优控制问题的最有效方法之一,成功地结合了神经网络、自适应评判设计、加强学习和经典动态规划等理论,同时有效地避免了“维数灾”问题,获得了广泛的关注和研究.本文主要基于自适应动态规划算法,讨论多智能体系统一致性问题、带领导者的时滞多智能体系统一致性问题、线性时滞耦合多智能体系统一致性问题、Buck型DC-DC变换器的输出跟踪控制问题和网络环境下的Buck型DC-DC变换器的输出跟踪控制问题.具体工作如下: 1)将ADP算法引入到多智能体系统一致性问题.通过对多智能体系统定义性能指标,多智能体系统的一致性问题转化为最优控制问题;然后利用ADP算法求解,给出了使多智能体系统实现一致性的最优控制的设计.算法简单高效,即使系统部分信息未知也可进行求解. 2)利用 ADP算法更深入地研究了线性时滞耦合多智能体系统一致性的反馈控制.将多智能体系统的一致性问题转化为最优控制问题;然后,引入变换消除系统的时滞;再由ADP算法来实现多智能体系统一致性的反馈控制的设计.在所设计的控制下,各多智能体能很快达到一致. 3)基于ADP算法研究了带领导者的时滞多智能体系统.将带领导者的多智能体系统化为相应的误差系统,通过引入变换消除时滞;再将多智能体系统的一致性问题转化为最优控制问题;最后由ADP算法得到系统实现一致性的反馈控制.在所设计的控制下,跟随者能快速跟踪到领导者. 4)结合ADP算法研究了Buck型DC-DC变换器在非网络环境和网络环境下的输出跟踪控制问题.由变换器系统构造误差跟踪系统;对于网络控制下的系统,还需再利用合适的变换消除时滞;最后,由ADP算法求解出占空比.在所设计的占比空下,系统的输出电压能很快跟踪到参考电压,具有很好的鲁棒性.