基于强化Q学习和BP神经网络的移动机器人局部路径规划行为研究

来源 :山东理工大学 | 被引量 : 1次 | 上传用户:qiushuicai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动机器人导航技术是当今人工智能领域的研究热点,包括建立地图、定位、路径规划等。为了赋予智能移动机器人自主学习的能力,实现和增强移动机器人局部路径规划功能,需要结合具有学习能力的机器学习方法进行移动机器人的局部路径规划行为研究。本文基于强化Q学习算法和BP神经网络模型,研究移动机器人局部路径规划行为。根据路径规划行为的任务要求,设计学习策略和控制规则,针对环境感知信息,提出了相应的控制策略,并进行了仿真验证。主要研究内容包括:基于栅格地图环境,提出了基于CM-Q学习的移动机器人局部路径规划算法。该算法首先根据强化Q学习算法和栅格地图,设计了移动机器人状态和动作,建立了Q矩阵;其次设计了一种坐标匹配(CM)的避障控制规则,以提高移动机器人避障效率;然后针对动作执行的评估问题,设计了回报函数;最后对CM-Q局部路径规划算法的有效性进行实验验证。对于规划路径中可能出现的冗余问题,通过增加学习次数和调整学习率等措施消除,使移动机器人在离散和连续障碍物环境中移动时不再出现冗余现象,运行效果良好。基于自由空间的地图环境和BP神经网络的泛化能力,提出了基于BPNN-Q学习的移动机器人局部路径规划算法。该算法首先根据移动机器人在地图环境中的状态,设计了传感器检测机制和动作选择策略;其次设计了动态的回报函数;然后根据特殊“U”型障碍物的避障要求,设计了三次震荡后退避障规则;最后进行BPNN-Q局部路径规划算法的有效性验证实验。实验结果表明,移动机器人可以在离散和连续的自由空间地图中,以任意起点和终点进行较优的局部路径规划,避障效果良好;对于特殊“U”型障碍物的避障也具有良好效果。
其他文献
随着虚拟化技术和计算机硬件的发展,越来越多的企业、政府、学校等机构开始应用桌面虚拟化产品,以提升办公效率,降低运营成本。桌面虚拟化系统的核心思想是“集中管理、分布
随着工业技术对轻量化设计的需求,加强筋结构的应用会越来越广泛。加强筋的宽度是评价加强筋力学性能的重要指标之一。因此,如何迅速、精确地检测出加强筋的宽度,对于在役设
随着电子商务的发展,人们对快递的应用和需求愈发强烈。如何快速分拣来自各地的快递件,提高工作效率已经成为目前快递行业面临的重要问题。在分拣过程中,人工分拣会造成暴力
用户偏好的学习,例如条件偏好网(Conditional Preference networks,CP-nets),已经成为人工智能研究的核心问题。当前的研究大多是从随机选择的示例或对等查询中对CP-nets进行结
随着科学技术的发展,诸如遥感、无人驾驶和目标识别等方面的计算机视觉应用变得越来越广泛,但是在有雾天气下获取的户外图像会受到雾气的影响,导致图像质量受到严重的退化。
Global Navigation Satellite System,简称GNSS(全球导航卫星系统)广泛应用于社会生活生产及经济活动中,如智能交通、互联网、移动通信、水文测绘等产业中,因此众多国家纷纷
移动边缘计算(Mobile Edge Computing,MEC)系统中,任务卸载策略作为系统的核心功能之一,自出现以来就受到了学者们的广泛关注。众多学者针对这一问题进行了研究。目前已有的
在过去的十几年里,单幅人脸图像的三维重建技术在计算机视觉和图形学领域中获得了很多的关注,其中自编码体素网络由于其轻量级、端到端以及受到模型表达的限制较小的优势在近
利用基底材料及外包覆纳米材料的表面增强效应可使被检测的物质或分子的发光光谱强度提高若干个数量级,这个特性已在拉曼增强光谱研究领域受到了海内外研究者的广泛关注并得
随着清洁能源的普遍应用,双有源桥变换器(Dual Active Bridge,DAB)倍受关注。由于DAB拥有效率高、能量双向流动、软开关、电气隔离等优点,因此在固态变压器、电动汽车、能量路由器和不间断电源中得到了广泛的应用。因此本文以DAB为变换器拓扑,提出了一种新的优化调制策略以及一种新的闭环控制策略。本文详细的分析了单重移相控制、扩展移相控制和三重移相控制的调制方式、软开关特性和功率特性。在