基于增强学习的移动机器人动态路径规划算法研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:sophiechenq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着机器人技术的发展,路径规划和多机器人系统逐渐成为机器人学的研究热点。移动机器人路径规划主要分为点到点的路径规划和完全覆盖路径规划。静态环境中的点到点路径规划经过多年的发展,算法相对成熟,而动态环境中由于环境信息的不确定性以及移动障碍物等因素,算法还有较大的发展空间。另一方面,单个机器人完全覆盖路径规划经过多年的发展已经取得一定进展,由于多机器人系统的任务分配和移动机器人动态路径规划方法研究还不够成熟导致多机器人系统完全覆盖路径规划还有许多问题有待解决。增强学习方法可以有效地解决不确定序贯决策问题,目前已经成为机器学习和人工智能领域的研究热点。由于增强学习方法对环境信息依赖少,因此,它在移动机器人路径规划方面的应用也受到广泛关注。本文对基于增强学习的移动机器人动态路径规划进行了深入研究,并与其它方法相结合用于解决多机器人系统完全覆盖路径规划问题。取得的研究成果包括:1.提出了基于神经网络的改进Q学习算法(Neural network based Improved Q-learning,NIQL),仿真结果表明NIQL算法在收敛速度方面相比于其它改进Q学习算法有很大提高;除此之外,通过将NIQL算法与三次B样条曲线相结合,提出了一种动态路径规划方法,该方法可以解决某些传统规划方法难以解决的问题,并在多种动态环境中进行了仿真实验,验证了该方法的有效性。2.通过将Q学习引入到传统RRT算法中,并对节点扩展函数以及随机节点生成函数进行改进,提出了基于Q学习的改进RRT算法(Q-learning based RRT,QRRT),仿真结果表明QRRT在扩展节点数、路径最优性和规划时间等方面相比于其它改进RRT算法具有较大优势;除此之外,通过将滚动规划、QRRT算法以及三次B样条相结合,提出了一种动态路径规划方法,并通过模拟公路超车仿真实验验证了该方法的有效性。3.通过将改进遗传算法、最小二乘策略迭代算法以及动态路径规划方法相结合,提出了一种多机器人系统完全覆盖路径规划方法,其中遗传算法用于多机器人系统任务分配,最小二乘策略迭代用于移动机器人局部避障规划,机器人之间通过划分优先级以及基于QRRT的动态规划方法解决碰撞问题,分别在简单和复杂环境中进行了仿真实验,验证了该方法的有效性。
其他文献
广义上实现材料连接有多种方法,如机械连接、化学连接(胶接)、冶金连接等。相比机械连接和化学连接,冶金连接可以通过材料间的熔合、物质迁移和塑性变形等而形成的材料在原子
目的观察肾移植患者术后应用FK506(普乐可复)的脑中枢神经系统症状。方法对71例肾移植患者术后应用FK506的血药浓度及神经系统症状和体征进行动态观察。结果 71例患者中有11
本文针对个税法的新旧比较及衔接问题进行研究,结合理论实践,在简要阐述个税法调整意义的基础上,对比分析了新旧个税法的差异性,并提出相应的衔接问题和整改措施。得出合理的
从竣工后路基沉降、桥头跳车处理、地下管线回填密度、沥青混凝土生产配比以及路面构造物高程等方面对路面平整度的影响进行分析,并提出相应的对策.
福建闽南民间舞蹈“拍胸舞”与鄂西土家族民间舞蹈“肉连响”,皆为列入中国国家级非物质文化遗产代表性项目名录的传统舞蹈。两者之间是否有其一定的内在关系,其关系究竟何在