论文部分内容阅读
足球机器人是目前人工智能领域研究的热点之一。它通过提供一个标准问题来促进人工智能和智能机器人的研究。这个领域可以集成并检验很大范围内的技术,同时也是推动信息领域产、学、研结合的重要途径。 足球机器人系统中,每个队的队员通过相互协作的运动控制完成比赛的任务。每个机器人不断观察环境的状态,通过决策过程给出对机器人左右轮速的信号。在这个过程中,高层决策往往给出一个运动目标点,经过路径规划后输出对机器人的控制信号。因此在足球机器人系统中,高层决策的智能度和路径规划算法的性能决定了足球机器人系统的控制性能。 机器人足球比赛的环境是一个动态、复杂、对抗的环境,并且每个机器人只能得到场上的不完全信息,如何使机器人能通过不断的学习提高自己的性能是开发足球机器人系统的关键内容。 机器人足球比赛过程中,由于存在竞争的一方,实时跟踪对手的行为状态、分析对手的思维和意图是对抗活动的基本前提,建立对手模型很有必要。本论文以Agent的BDI模型为思维模型,在概率信念逻辑基础上,引入换位原理,给出了一种多智能体对手建模的新思路并将之应用到机器人足球比赛中。通过对敌对的足球机器人团队进行建模,对对方的行为进行合理预测,并且采取相应的行动以创造机会遏制对方的行动。本文提出的方法,还可以达到在动态开放环境下,特别是信息不完全的情况下实时推断机器人团队中其他同伴的思维状态,为团队协作提供支持。另外,对手建模的过程也是学习对手的过程,可以将从对手那里学习到的有效的策略加入到自己的知识信念库里,以丰富本方策略。 足球机器人系统中,路径规划是高层决策和底层控制间的衔接部分,路径规划算法的性能在很大程度上影响机器人队员的性能。本论文将增强式学习算法和人工势场法相结合,提出状态评价函数和势场的对应关系,以及控制策略和势场力方向的对应关系,通过机器人的自适应学习,来形成优化的人工势场,使机器人能够以最短路径绕过障碍,到达目标。同基于传统人工势场法相比,此方法避免了不合理势场方程所引起的局部极小值问题,而且通过学习得到的策略,可以得到从任意起始位置开始的最优路径。通过实验表明本文方法能有效解决多障碍环境中机器人避碰和导航问题,实现了动态环境中实时、无碰和优化的路径规划,并具有较好的实时性能。