非策略Q-学习相关论文
针对离散系统鲁棒非策略Q-学习算法的研究的必要性进行了分析和验证。首先提出了最优控制问题,然后利用Q-学习算法设计了基于数据......
本文针对具有数据包丢失的网络化控制系统跟踪控制问题,提出了一种新的非策略Q-学习方法,完全利用可测数据,在系统模型参数未知并......

