有限通信下多智能体系统的编队研究

来源 :广西科技大学 | 被引量 : 0次 | 上传用户:dustfly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
引起科研工作者的普遍关注。编队控制问题作为多智能体系统协同的一个重要方向,其含义为在控制协议的作用下,具有自主能力的个体能够形成且保持期望的几何队形。通常在多智能体系统的编队控制研究中,人们大多关注编队控制协议的设计问题,很少研究在恶劣环境下多智能体系统的资源受限问题(如计算能力不足、有限的通信带宽、能耗太大)。基于此,本文主要研究内容包括:首先,针对多智能体系统有限通信速度和带宽问题,研究在一类有向非平衡拓扑下的量化通信多智能体系统环形编队控制问题,其中网络通信拓扑包含一个有向生成树,且每个智能体仅能感知到它与逆时针方向邻居的角度距离。为此,我们结合编码-解码器框架,设计一种新型控制算法。在所设计的算法下,每个智能体状态都能以指数收敛速率收敛到期望的平衡点,数值仿真结果验证该算法的可行性。其次,为减少多智能体系统的能耗和计算负载,分别研究采用一阶动力学、二阶动力学描述的多智能体系统事件驱动问题,设计集中式、分布式事件条件和控制协议,其中网络通信结构为有向非平衡拓扑,控制器更新由状态测量偏差与阈值函数的大小决定。在所设计的控制协议下,每个智能体的状态都能达到期望的平衡点,且多智能体系统可以避免Zeno现象,数值仿真结果验证了该算法的有效性。最后,针对经典强化学习的多智能体编队存在通信和计算资源消耗大的问题,本文引入事件驱动控制机制,智能体的动作决策无须按固定周期进行,而依赖于事件驱动条件更新智能体动作。在设计事件驱动条件时,不仅考虑智能体的累积奖赏值,还引入智能体与邻居奖赏值的偏差,智能体间通过交互来寻求最优联合策略实现编队。数值仿真结果表明,基于事件驱动的强化学习多智能体编队控制算法,在保证系统性能的情况下,能有效降低多智能体的动作决策频率和资源消耗。
其他文献
1故障现象某日,我处某110kV变电站1号直流屏发出报警信号。检查直流屏各支路绝缘电阻,Ⅱ段母线负控母绝缘电阻降至30~50kΩ,而正常时绝缘电阻为999.9kΩ。当时该变电站有两组工作
目的探讨改良造口护理方法在回肠造口术后早期护理的应用效果。方法选取2015年1月-2016年12月于广西玉林市第一人民医院行直肠低位前切除加预防性回肠造口术的患者62例,以201
为了提高激光诱导击穿光谱技术用于水溶液中痕量重金属检测的稳定性和灵敏度,采用液体喷流的方式,利用激光诱导击穿光谱技术对不同浓度的Cr溶液进行了检测和分析.通过对实验
SPD(surge protective device)中文名为电涌保护器,亦称为浪涌保护器。SPD至少包含一个非线性电压限制元件,用于限制暂态过电压和分流电涌电流。按照电涌保护器的功能,可分为电源
分别以街道、社区为单位将长春市中心城区第五次、第六次普查数据通过 ArcGIS 软件导入城镇数据,对长春市中心城区人口分布现状进行分析,并通过 MATLAB 软件对十年以来长春市中
目的:探究高住低练与低住低练两种训练模式下肥胖抵抗大鼠能量代谢的变化,明确两种训练模式对肥胖抵抗大鼠能量代谢影响的差异.方法:适应性训练后筛选出肥胖大鼠8只、肥胖抵抗大
1故障现象 2008年12月21日,温度骤降。13:20,车集煤矿35kV1号主变在运行时发出轻瓦斯报警信号。运行人员立刻到现场检查1号主变,发现变压器声音正常,油位较前日有所降低,瓦斯继电器