切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
基于随机博弈的Agent协同强化学习方法
基于随机博弈的Agent协同强化学习方法
来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:birchwoods2010
【摘 要】
:
本文针对一类追求系统得益最大化的协作团队的学习问题,基于随机博弈的思想,提出了一种新的多Agent协同强化学习方法。协作团队中的每个Agent通过观察协作相识者的历史行为,依照
【作 者】
:
王长缨
尹晓虎
鲍翊平
姚莉
【机 构】
:
国防科技大学管理科学与工程系
【出 处】
:
计算机工程与科学
【发表日期】
:
2006年2期
【关键词】
:
强化学习
多AGENT系统
随机博弈
协作
reinforcement learning
multi-agent system
stochastic gam
【基金项目】
:
国家自然科学基金资助项目(70371008)
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对一类追求系统得益最大化的协作团队的学习问题,基于随机博弈的思想,提出了一种新的多Agent协同强化学习方法。协作团队中的每个Agent通过观察协作相识者的历史行为,依照随机博弈模型预测其行为策略,进而得出最优的联合行为策略。
其他文献
基于Markov预测模型的动态足球机器人阵型策略方法
本文设计并实现了一种新的实体机器人足球比赛中队伍阵型策略方法,此方法建立在对球的Markov预测模型基础上,将目标和阵型相融合,实现了阵型的动态选择以及阵型间的动态切换
期刊
机器人足球
阵型
卡尔曼滤波
模糊评判
robot soccer
formation
Kalman filtering
fuzzy judging
其他学术论文