多Agent Q学习几点问题的研究及改进

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:dlghk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种新颖的基于Q-学习,蚁群算法和轮盘赌算法的多Agent强化学习。在强化学习算法中,当Agent数量增加到足够大时,就会出现动作空间灾难性问题,即:其交互困难,学习速度骤然下降。另外,由于Agent是利用Q值来选择下一步动作的,因此,在学习早期,动作的选择严重束缚于高Q值。在这里,把蚁群算法,轮盘赌算法和强化学习三者结合起来,期望解决上述提出的问题。最后,对新算法的理论分析和实验结果都证明了改进的Q学习是可行的,并且可以有效的提高学习效率。
其他文献
文章探讨了西部大开发战略实施以来,西部地区在经济增长的效率、动力与协调性三个方面的变化情况。结果表明,10余年来,西部地区的劳动和土地产出效率明显改善,但资本的产出效
中国城市发展的阶段性特征引起了对制度约束与多中心条件下城市规模的重新思考。在这两个条件下经典城市规模模型中农业用地价格和通勤成本对城市规模的解释遇到困境。对中国