论文部分内容阅读
受生物集群行为的启发,集群系统内独立个体通过相对简单的局部交互行为规则,使得系统整体能够涌现出远超个体能力的群体智能。这种无中心的、自组织的、自治的集群系统,具有很强的稳定性、灵活性和自愈性。随着无人机技术的不断进步,无人机朝着轻量化、智能化和集群化发展,无人机集群也已然成为近年来的一个研究热点。本文以无人机集群为研究对象,重点研究集群并发区域覆盖与目标跟踪问题,构建相对应的集群自组织区域覆盖与多目标协同跟踪优化模型,提出了最佳速度搜索算法和决策优化算法。本文主要工作及贡献如下:(1)并发覆盖与跟踪框架及速度空间模型设计了一种可用于无人机集群的并发覆盖与跟踪框架,其将区域覆盖、目标跟踪以及任务分配这三项重要的子任务进行耦合,通过这种方式能够在最大化集群覆盖能力的同时进行多目标跟踪,尽可能地发挥集群系统最大效能,较传统解耦单一规划框架具有更好的综合性能。其次,设计了一种速度空间优化模型,其将集群区域覆盖与目标跟踪问题直接在速度域内进行建模,较传统位型空间模型具有计算量小、实时性高、扩展性强的优点。(2)基于互惠机制的集群自组织区域覆盖提出了一种可用于集群自组织区域覆盖任务的互惠决策方法,该方法是基于本文设计的速度空间优化模型,考虑了无人机集群内邻近个体间的互惠行为,直接在速度域内构建出最佳覆盖速度空间。同时,构建的最佳覆盖速度空间也在本文中被证明为无碰撞空间,即选择此空间内的速度均有利于集群覆盖任务的完成,同时能够避免与其他无人机或障碍之间的碰撞。此外,针对构建的最佳覆盖速度空间形态未定且可能不可达的问题,设计了一种基于蒙特卡洛的随机概率方法搜索最佳覆盖速度,并通过数学证明及数值测试验证了它的有效性。通过大规模群体仿真实验以及基于机器人操作系统的集群覆盖仿真实验,验证了方法的有效性,较Voronoi分割法这类分区决策型代表算法和虚拟力法这类直接决策型代表算法具有更高的覆盖率、更快的收敛速度和计算速度。(3)基于互惠机制的集群并发覆盖与跟踪提出了一种无人机集群并发区域覆盖与目标跟踪的互惠控制方法,该方法有效地实现无人机集群同时对区域进行覆盖以及对目标进行跟踪的双任务协同决策。根据决策优化过程中出现的感知区域内无目标及最佳速度空间为空集的情况,设计了相对应的算法和策略进行优化选择。通过静态目标和动态目标下的并发覆盖与跟踪实验,以及三维多机器人动力学仿真平台Gazebo的验证,说明了方法较维诺图控制法和密度控制法具有更高的覆盖率和目标跟踪率。(4)基于深度强化学习的集群覆盖与跟踪提出了一种基于深度强化学习的并发覆盖与跟踪方法。针对反应式和路径式方法均难以对任务时间进行快速有效优化的问题,利用基于互惠机制的并发覆盖与跟踪方法生成大量轨迹数据集初始化价值网络,实现对任务时间进行预估学习并加速动作策略的学习收敛。学习训练得出最快完成任务的最佳动作策略价值网络,不单可用于双机协同覆盖与跟踪,同时也可扩展运用到集群覆盖与跟踪问题上。该方法具有很强的实时性和可靠性,单机在线动作决策时间平均约为7.3ms,覆盖任务完成时间较基于互惠机制的并发覆盖与跟踪方法缩短了31.51%。最后,通过硬件在环仿真实验,进一步验证了该方法用于无人机集群异步分布式系统中的可行性和有效性。