基于径向基函数网络的强化学习在机器人足球中的研究

来源 :系统仿真学报 | 被引量 : 0次 | 上传用户:k1389520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
与监督学习从范例中学习的方式不同,强化学习不需要先验知识,而是具有从经验中学习的能力.将强化学习应用在大状态空间中,必须应用函数逼近的方法,如使用径向基函数网络建立输入和输出的映射关系.本文对基于径向基函数网络的强化学习在机器人足球这样的动态的多智能体环境中的应用进行了研究.实验结果证明了研究方法的可行性.
其他文献
在查阅资料,考证、分析《太原水利禁令公文碑》的基础上,指出:有明一代,在国家法缺位的领域,民间水利规约得到了官府的认可,进而进入到司法适用领域,使得地方水利规约与司法实
提出了一种新的Sugeno模糊模型辨识算法。在Sugeno模糊模型辨识中,应用模糊聚类方法可将其前提结构和结论参数的辨识分开进行,减少了计算量;通过Box-Jinkins数据建模说明了本文算法的有效性。
以新一轮高考改革为背景,针对高中"走班制"教学改革的实践,对高中"走班制"教学改革实践进行了探索。试构建基本的、较为合理的"走班制"教学管理机制,对"走班制"教学改革的问
2012年11月14日,2012中国国际创意设计推广周在京举办,来自世界各地的创意展品竟相亮相。在本届展览会上,由山东工艺美术学院教务处承办、各教学单位参与的《设计·生活——
介绍城市色彩的含义及其重要性,针对城市规划中城市色彩不统一、建设领域的色彩应用混乱等现象,提出在规划城市色彩、编制规范与建设城市方谣应注意三个原则:功能相符原则、和谐
<正>~~
期刊
本文通过对西宁市化工园区存在问题的分析,围绕建设无污染生态型化工园区的战略目标,提出了市场化、产业化、生态化的规划设计理念和"两带五区"的规划布局结构.
在L-Fuzzy双拓扑空间中引入θij-连续,给出LFθij-闭集,LFθij-开集和LFθij-连续性之间的关系,得出一些LFθij-闭集和LFθij-开集的性质