论文部分内容阅读
近年来,随着机器人技术的发展,路径规划和多机器人系统逐渐成为机器人学的研究热点。移动机器人路径规划主要分为点到点的路径规划和完全覆盖路径规划。静态环境中的点到点路径规划经过多年的发展,算法相对成熟,而动态环境中由于环境信息的不确定性以及移动障碍物等因素,算法还有较大的发展空间。另一方面,单个机器人完全覆盖路径规划经过多年的发展已经取得一定进展,由于多机器人系统的任务分配和移动机器人动态路径规划方法研究还不够成熟导致多机器人系统完全覆盖路径规划还有许多问题有待解决。增强学习方法可以有效地解决不确定序贯决策问题,目前已经成为机器学习和人工智能领域的研究热点。由于增强学习方法对环境信息依赖少,因此,它在移动机器人路径规划方面的应用也受到广泛关注。本文对基于增强学习的移动机器人动态路径规划进行了深入研究,并与其它方法相结合用于解决多机器人系统完全覆盖路径规划问题。取得的研究成果包括:1.提出了基于神经网络的改进Q学习算法(Neural network based Improved Q-learning,NIQL),仿真结果表明NIQL算法在收敛速度方面相比于其它改进Q学习算法有很大提高;除此之外,通过将NIQL算法与三次B样条曲线相结合,提出了一种动态路径规划方法,该方法可以解决某些传统规划方法难以解决的问题,并在多种动态环境中进行了仿真实验,验证了该方法的有效性。2.通过将Q学习引入到传统RRT算法中,并对节点扩展函数以及随机节点生成函数进行改进,提出了基于Q学习的改进RRT算法(Q-learning based RRT,QRRT),仿真结果表明QRRT在扩展节点数、路径最优性和规划时间等方面相比于其它改进RRT算法具有较大优势;除此之外,通过将滚动规划、QRRT算法以及三次B样条相结合,提出了一种动态路径规划方法,并通过模拟公路超车仿真实验验证了该方法的有效性。3.通过将改进遗传算法、最小二乘策略迭代算法以及动态路径规划方法相结合,提出了一种多机器人系统完全覆盖路径规划方法,其中遗传算法用于多机器人系统任务分配,最小二乘策略迭代用于移动机器人局部避障规划,机器人之间通过划分优先级以及基于QRRT的动态规划方法解决碰撞问题,分别在简单和复杂环境中进行了仿真实验,验证了该方法的有效性。