一种新的连续动作集学习自动机

来源 :数据采集与处理 | 被引量 : 0次 | 上传用户：suibiannicheng

【摘要】

：

学习自动机（Learning automation,LA）是一种自适应决策器。其通过与一个随机环境不断交互学习从一个允许的动作集里选择最优的动作。在大多数传统的LA模型中,动作集总是被取作

【作者】

：

刘晓毛宁

【机构】

：

中航工业西安航空计算技术研究所

【出处】

：

数据采集与处理

【发表日期】

：

2015年6期

【关键词】

：

机器学习强化学习在线学习学习自动机连续动作集学习自动机 machine learning reinforcement learning online l

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

学习自动机（Learning automation,LA）是一种自适应决策器。其通过与一个随机环境不断交互学习从一个允许的动作集里选择最优的动作。在大多数传统的LA模型中,动作集总是被取作有限的。因此,对于连续参数学习问题,需要将动作空间离散化,并且学习的精度取决于离散化的粒度。本文提出一种新的连续动作集学习自动机（Continuous action-set learning automaton,CALA）,其动作集为一个可变区间,同时按照均匀分布方式选择输出动作。学习算法利用来自环境的二值反馈信号对动作

其他文献

包头地区毛茛科野生观赏植物资源及利用

系统地报道了包头地区毛茛科野生观赏植物资源,并对其观赏价值做了评估,提出了开发利用的建议.

期刊

包头地区毛茛科野生观赏植物资源开发利用

高校实施文档一体化管理的理论与实践

计算机的广泛应用,为高校实行文档一体化管理提供了技术支持,电子文件的出现要求档案工作向文件管理延伸,从而在文件生成之日起就得到质量控制,结合长期从事档案管理与文件管

期刊

文档一体化理论实践documents integrationtheorypractice

松辽盆地梨树断陷营城组沉积微相特征及意义

松辽盆地梨树断陷营城组是一套以碎屑岩沉积为主的地层,其主要岩性为正常碎屑沉积岩,火山碎屑沉积岩居次。砂岩在所有岩性中所占比重最大,主要为长石岩屑砂岩和岩屑长石砂岩

期刊