基于增强学习的移动机器人动态路径规划算法研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户：sophiechenq

【摘要】

：

近年来,随着机器人技术的发展,路径规划和多机器人系统逐渐成为机器人学的研究热点。移动机器人路径规划主要分为点到点的路径规划和完全覆盖路径规划。静态环境中的点到点路

【作者】

：

李斯定

【出处】

：

国防科学技术大学

【发表日期】

：

2015年期

【关键词】

：

动态路径规划增强学习多机器人系统完全覆盖路径规划

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,随着机器人技术的发展,路径规划和多机器人系统逐渐成为机器人学的研究热点。移动机器人路径规划主要分为点到点的路径规划和完全覆盖路径规划。静态环境中的点到点路径规划经过多年的发展,算法相对成熟,而动态环境中由于环境信息的不确定性以及移动障碍物等因素,算法还有较大的发展空间。另一方面,单个机器人完全覆盖路径规划经过多年的发展已经取得一定进展,由于多机器人系统的任务分配和移动机器人动态路径规划方法研究还不够成熟导致多机器人系统完全覆盖路径规划还有许多问题有待解决。增强学习方法可以有效地解决不确定序贯决策问题,目前已经成为机器学习和人工智能领域的研究热点。由于增强学习方法对环境信息依赖少,因此,它在移动机器人路径规划方面的应用也受到广泛关注。本文对基于增强学习的移动机器人动态路径规划进行了深入研究,并与其它方法相结合用于解决多机器人系统完全覆盖路径规划问题。取得的研究成果包括:1.提出了基于神经网络的改进Q学习算法(Neural network based Improved Q-learning,NIQL),仿真结果表明NIQL算法在收敛速度方面相比于其它改进Q学习算法有很大提高;除此之外,通过将NIQL算法与三次B样条曲线相结合,提出了一种动态路径规划方法,该方法可以解决某些传统规划方法难以解决的问题,并在多种动态环境中进行了仿真实验,验证了该方法的有效性。2.通过将Q学习引入到传统RRT算法中,并对节点扩展函数以及随机节点生成函数进行改进,提出了基于Q学习的改进RRT算法(Q-learning based RRT,QRRT),仿真结果表明QRRT在扩展节点数、路径最优性和规划时间等方面相比于其它改进RRT算法具有较大优势;除此之外,通过将滚动规划、QRRT算法以及三次B样条相结合,提出了一种动态路径规划方法,并通过模拟公路超车仿真实验验证了该方法的有效性。3.通过将改进遗传算法、最小二乘策略迭代算法以及动态路径规划方法相结合,提出了一种多机器人系统完全覆盖路径规划方法,其中遗传算法用于多机器人系统任务分配,最小二乘策略迭代用于移动机器人局部避障规划,机器人之间通过划分优先级以及基于QRRT的动态规划方法解决碰撞问题,分别在简单和复杂环境中进行了仿真实验,验证了该方法的有效性。

其他文献

先进材料连接技术综述

广义上实现材料连接有多种方法,如机械连接、化学连接(胶接)、冶金连接等。相比机械连接和化学连接,冶金连接可以通过材料间的熔合、物质迁移和塑性变形等而形成的材料在原子

期刊

材料连接技术新技术新工艺Material bonding technologynew technologynew process

肾移植术后应用FK506的神经毒性作用

目的观察肾移植患者术后应用FK506(普乐可复)的脑中枢神经系统症状。方法对71例肾移植患者术后应用FK506的血药浓度及神经系统症状和体征进行动态观察。结果 71例患者中有11

期刊

肾移植FK506免疫抑制剂神经药理学毒理学kidney transplantation tacrolimus immunosuppressive ag

重庆缙云山抓保护促发展

期刊

缙云山国家级自然保护区重庆市重庆缙云山山甜茶社会治安综合治理促发展林业总产值