基于Q-学习的进化博弈决策模型

来源 :中国系统工程学会第十五届年会 | 被引量 : 0次 | 上传用户：ttttt2046

【摘要】

：

基于Q-强化学习算法,建立了进化博弈中代理人的决策模型.考虑到强化学习算法不需要建立环境模型,可以用于不完全、不确定信息问题中,将Q-强化学习算法引入到进化博弈中,研究

【作者】

：

刘伟兵王先甲

【机构】

：

武汉大学系统工程研究所,武汉 430072

【出处】

：

中国系统工程学会第十五届年会

【发表日期】

：

2008年期

【关键词】

：

强化学习算法进化博弈决策模型代理人最优策略信息问题环境模型仿真算例博弈选择

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

基于Q-强化学习算法,建立了进化博弈中代理人的决策模型.考虑到强化学习算法不需要建立环境模型,可以用于不完全、不确定信息问题中,将Q-强化学习算法引入到进化博弈中,研究了进化博弈中的两种Q-学习决策模型:单代理人Q-学习决策模型和多代理人Q-学习决策模型,并针对不同结构的进化博弈选择不同的决策模型和算法进行了讨论.仿真算例的结果说明基于Q-学习的决策模型能指导代理人学习、选择最优策略.

其他文献

基于Q-学习的进化博弈决策模型

其他学术论文