基于一般和随机对策论框架下的多智能体学习

来源 :自动化学报 | 被引量 : 0次 | 上传用户：longyonghong520

【摘要】

：

将Q-learning从单智能体框架上扩展到非合作的多智能体框架上,建立了在一般和随机对策框架下的多智能体理论框架和学习算法,提出了以Nash平衡点作为学习目标.给出了对策结构

【作者】

：

【机构】

：

上海交通大学自动化系

【出处】

：

自动化学报

【发表日期】

：

2002年3期

【关键词】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

将Q-learning从单智能体框架上扩展到非合作的多智能体框架上,建立了在一般和随机对策框架下的多智能体理论框架和学习算法,提出了以Nash平衡点作为学习目标.给出了对策结构的约束条件,并证明了在此约束条件下算法的收敛性, 对多智能体系统的研究与应用有重要意义.

其他文献

在混合估计中,交互式多模型滤波器(IMM--Interacting MultipIe Model)以其优越的性能而受到广泛的研究.由于马尔可夫参数的限定,交互式多模型在模型数较多时会出现精度下降,

期刊

本研究基于全国14000份本科生调查样本,采用回归模型和系数集束化方法,分析了课堂教学以及学生课堂参与在本科生专业能力增值中的作用,并对“教师中心”教学、“学生中心”教

期刊