论文部分内容阅读
随着计算机网络和人工智能等技术的发展,智能体(Agent)的研究已成为分布式人工智能(DM—Distributed Artificial Intelligent)研究的一个热点。Agent的理论、技术,特别是MAS(Multi Agent System)的理论技术不仅为解决新的分布式应用问题提供了有效的途径,还为全面准确地研究分布式计算系统的特点提供了合理的概念模型,给我们带来设计和实现可运行在分布与开放环境中的软件系统的一个全新模式,成为描述复杂现象、研究复杂系统、实现复杂自适应性计算的方法。MAS首先根据所研究的问题,定义单个Agent,给Agent赋予一定的行为和参数;然后,定义Agent之间以及Agent和环境之间的交互规则;最后,通过Agent之间的交互活动产生解决问题的能力。由此可见,构造Agent和设计Agent之间的协作是MAS技术的核心。本文针对目前的多Agent协作研究缺乏个性倾向和个性特质模型研究,提出了CRLBP(Cooperative Reinforcement Learning based Personality)模型,试图从另一个侧面解决多Agent协作问题。本文的主要工作包括:(1)提出个性Agent模型,即将个性行为绑定到信息Agent上,并详细描述与形式化具有个性的信息Agent使各个性Agent更匹配任务中的角色位置。(2)将个性hgent模型引入到协作协议中,基于个性Agent的协作强化学习模型(CRLBP),该模型将传统的从单个Agent角度出发的强化学习,应用到Agent群体的协作强化学习,对CRLBP模型与传统模型进行对比实验,在传球和截球方面,CRLBP比传统模型有优势。(3)提出了概率性分布函数并通过评估函数进行修正,形式化了个性Agent,并进行了仿真实验,实验表明与不采用个性的Agent对比,在对单个Agent的传球和截球方面的能力有提高。(4)在机器人足球比赛(RoboCup)仿真平台下,应用CRLBP模型进行Agent体系结构,底层动作,协调策略设计。CRL8P模型基本思想是:在Agent结构中引入个性的概念,根据概率性分布函数动态地修正个性Agent的思维状态,基于个性Agent实现协作强化学习。