基于随机博弈的Agent协同强化学习方法

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:birchwoods2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对一类追求系统得益最大化的协作团队的学习问题,基于随机博弈的思想,提出了一种新的多Agent协同强化学习方法。协作团队中的每个Agent通过观察协作相识者的历史行为,依照随机博弈模型预测其行为策略,进而得出最优的联合行为策略。
其他文献
本文设计并实现了一种新的实体机器人足球比赛中队伍阵型策略方法,此方法建立在对球的Markov预测模型基础上,将目标和阵型相融合,实现了阵型的动态选择以及阵型间的动态切换