论文部分内容阅读
与监督学习从范例中学习的方式不同,强化学习不需要先验知识,而是具有从经验中学习的能力.将强化学习应用在大状态空间中,必须应用函数逼近的方法,如使用径向基函数网络建立输入和输出的映射关系.本文对基于径向基函数网络的强化学习在机器人足球这样的动态的多智能体环境中的应用进行了研究.实验结果证明了研究方法的可行性.