论文部分内容阅读
路径规划是移动机器人研究领域中的关键技术之一,是机器人完成其它高级任务的必要基础。本文主要针对复杂环境下的移动机器人路径规划及其相关问题进行了研究,着重研究了静态未知环境下和动态未知环境下路径规划问题。旨在使移动机器人通过学习获得在静态未知和动态未知等不同复杂环境下具有实时性和有效性的路径规划策略,使得移动机器人提高适应环境变化的路径规划能力,从而为移动机器人的进一步实用化奠定基础。
本文首先对静态未知环境下的路径规划方法进行了讨论。分别采用启发式搜索算法中的A*算法和强化学习算法中的Q-learning算法实现静态部分未知和完全未知环境下的局部路径规划,通过仿真和实验结果系统地分析了两类算法的特点,并在此基础上重新界定了两类算法各自的适用范围,对A*算法和Q-learning算法进行了改进,提高了算法对环境信息的利用率和收敛速度。
最后在动态复杂环境中,在强化学习算法中的Sarsa学习算法的基础上,引入信度分配函数,提出了基于信度分配的Sarsa学习算法实现在动态未知环境下的路径规划。Sarsa学习算法是一种在线学习算法,但其学习速度慢,不能根据实时的环境信息合理地分配报酬,及时调整策略,引入的信度分配函数用来在各行动规则间分配报酬,进而修改动作选择策略,能够更加适应环境的变化,有效地提高了算法的计算速度和自适应性,实现了动态未知环境下的路径规划。