论文部分内容阅读
多智能体协作问题是近年来分布式人工智能领域研究的一个热点。RoboCup作为验证多智能体一个理想平台,被越来越多的学者用来验证协作算法的可行性和有效性。本文以RoboCup-2D仿真比赛为研究对象,研究多智能体间的协作问题。论文完成的主要工作有:(1)针对RoboCup-2D仿真比赛中多智能体协作的问题,提出一种三层多智能体协作模型。通过实际应用表明,该模型不仅能提高RoboCup-2D仿真系统中智能体的智能性,而且有利于智能体间的实时动态协作;(2)研究了在RoboCup-2D仿真比赛中球队阵形变换与角色转换中智能体间的协作关系。通过阵形来约束智能体的行为,使多智能体之间具有一定的协作性;通过引入角色的概念并与阵形变换相结合,实现了基于阵形变换与角色转换的多智能体动态协作;采用Petri-net建模方法对阵形变换与角色转换过程中智能体的协作关系进行建模,并分析了模型的各种性能指标,然后将其应用到RoboCup-2D仿真比赛中,从理论和实际两方面验证了模型的正确性和可行性;(3)采用Q学习算法来对RoboCup-2D仿真比赛中单智能体的行为决策进行训练。通过智能体在RoboCup-2D仿真比赛带球跑位中的实际应用,验证了Q学习算法在解决单智能体行为决策时的有效性;(4)为了解决多智能体间的协作问题,在Q学习算法基础上提出了联合Q学习算法,并将该算法成功应用到RoboCup-2D传球协作中。实验结果表明,联合Q学习算法比传统的Q学习算法能更有效的解决多智能体间的协作问题。论文最后将上述研究成果应用于RoboCup-2D仿真比赛中,来验证协作方法和策略的有效性和正确性。