切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
基于一般和随机对策论框架下的多智能体学习
基于一般和随机对策论框架下的多智能体学习
来源 :自动化学报 | 被引量 : 0次 | 上传用户:longyonghong520
【摘 要】
:
将Q-learning从单智能体框架上扩展到非合作的多智能体框架上,建立了在一般和随机对策框架下的多智能体理论框架和学习算法,提出了以Nash平衡点作为学习目标.给出了对策结构
【作 者】
:
欧海涛
张卫东
许晓鸣
【机 构】
:
上海交通大学自动化系
【出 处】
:
自动化学报
【发表日期】
:
2002年3期
【关键词】
:
随机对策论
多智能体学习
学习算法
强化学习
Multi-agent
Q-learning
stochastic games
Nash equilibri
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将Q-learning从单智能体框架上扩展到非合作的多智能体框架上,建立了在一般和随机对策框架下的多智能体理论框架和学习算法,提出了以Nash平衡点作为学习目标.给出了对策结构的约束条件,并证明了在此约束条件下算法的收敛性, 对多智能体系统的研究与应用有重要意义.
其他文献
两级交互式多模型算法
在混合估计中,交互式多模型滤波器(IMM--Interacting MultipIe Model)以其优越的性能而受到广泛的研究.由于马尔可夫参数的限定,交互式多模型在模型数较多时会出现精度下降,
期刊
交互式多模型算法
自适应滤波
噪声辨识
系统辨识
IMM
adaptive filtering
noise identification.
“教”与“学”对本科生专业能力增值影响的实证分析
本研究基于全国14000份本科生调查样本,采用回归模型和系数集束化方法,分析了课堂教学以及学生课堂参与在本科生专业能力增值中的作用,并对“教师中心”教学、“学生中心”教
期刊
课堂教学
学生参与
“学生中心”教学
专业能力
其他学术论文