论文部分内容阅读
论文首先对移动机器人群体行为设计的研究现状进行了简单的论述,并对多移动机器人协作系统的特点、体系结构进行简要的概述。接下来,介绍了与本协作机器人研究相关的背景知识和相关工作,包括多机器人的学习与自适应的介绍以及协作机器人系统的研究现状。第三章,研究了多机器人协作行为自学习的问题,采用分配矩阵进行回报的方法,充分利用强化学习过程中偶然发生的行为组合,通过强化学习算法,重新组合状态行为对,形成稳定的映射策略,实现了多机器人传接协作搬运的任务。详细介绍了算法的实现方法,并且进行了仿真。第四章,研究了多机器人群体行为自适应问题,基于多机器人觅食任务,通过Teambots仿真结果,对各种算法的性能进行比较,总结出有概率的模仿学习是一种大规模机器人协作行为自适应的有效方法,该方法在学习效果、学习速度、学习的规模等方面的综合性能最高。