基于径向基函数网络的强化学习在机器人足球中的研究

来源 :系统仿真学报 | 被引量 : 0次 | 上传用户：k1389520

【摘要】

：

与监督学习从范例中学习的方式不同,强化学习不需要先验知识,而是具有从经验中学习的能力.将强化学习应用在大状态空间中,必须应用函数逼近的方法,如使用径向基函数网络建立

【作者】

：

罗青李智军 Iqbal Nadeem 吕恬生

【机构】

：

上海交通大学机器人研究所

【出处】

：

系统仿真学报

【发表日期】

：

2002年8期

【关键词】

：

径向基函数强化学习机器人足球多智能体 multi-agent robot soccer reinforcement learning RBFNs

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

与监督学习从范例中学习的方式不同,强化学习不需要先验知识,而是具有从经验中学习的能力.将强化学习应用在大状态空间中,必须应用函数逼近的方法,如使用径向基函数网络建立输入和输出的映射关系.本文对基于径向基函数网络的强化学习在机器人足球这样的动态的多智能体环境中的应用进行了研究.实验结果证明了研究方法的可行性.

其他文献

明代地方水利旧制的司法实践——以《太原水利禁令公文碑》为例

在查阅资料,考证、分析《太原水利禁令公文碑》的基础上,指出：有明一代,在国家法缺位的领域,民间水利规约得到了官府的认可,进而进入到司法适用领域,使得地方水利规约与司法实

期刊

明代水利旧制司法《太原水利禁令公文碑》Ming Dynasty water conservancy old chapter judicature

Sugeno模糊模型的辨识

提出了一种新的Sugeno模糊模型辨识算法。在Sugeno模糊模型辨识中,应用模糊聚类方法可将其前提结构和结论参数的辨识分开进行,减少了计算量;通过Box-Jinkins数据建模说明了本文算法的有效性。

期刊

模糊控制SUGENO模糊模型系统辨识fuzzy control Sugeno抯 fuzzy model system identification

新高考改革背景下“走班制”教学模式实践研究——以沈阳大学虎石台附属实验中学为例

以新一轮高考改革为背景,针对高中"走班制"教学改革的实践,对高中"走班制"教学改革实践进行了探索。试构建基本的、较为合理的"走班制"教学管理机制,对"走班制"教学改革的问

期刊

新高考改革“走班制”教学模式

山东工艺美术学院参展2012中国国际创意设计推广周

2012年11月14日，2012中国国际创意设计推广周在京举办，来自世界各地的创意展品竟相亮相。在本届展览会上，由山东工艺美术学院教务处承办、各教学单位参与的《设计·生活——

期刊

山东工艺美术学院创意设计推广国际中国教学单位展示形式独具匠心

浅议城市色彩与历史文化

介绍城市色彩的含义及其重要性，针对城市规划中城市色彩不统一、建设领域的色彩应用混乱等现象，提出在规划城市色彩、编制规范与建设城市方谣应注意三个原则：功能相符原则、和谐

期刊

城市色彩历史文化功能相符环境和谐延续文脉

山东工艺美术学院学生作业

<正>~~

期刊

西宁市化工园区更新改造规划设计初探

本文通过对西宁市化工园区存在问题的分析,围绕建设无污染生态型化工园区的战略目标,提出了市场化、产业化、生态化的规划设计理念和"两带五区"的规划布局结构.

期刊

化工园区规划理念规划布局Chemical industry areaPlanning and designing idea Planning allo

LF双拓扑空间的θij—集与θij—连续

在L-Fuzzy双拓扑空间中引入θij-连续,给出LFθij-闭集,LFθij-开集和LFθij-连续性之间的关系,得出一些LFθij-闭集和LFθij-开集的性质

期刊

LF双拓扑空间LFθij-闭集LFθij-开集LFθij-连续序同态θij-附着点FUZZY格LF bitopological spacesθi

基于径向基函数网络的强化学习在机器人足球中的研究

其他学术论文