MAXQ方法在出租车问题中的应用

来源 :茂名学院学报 | 被引量 : 0次 | 上传用户：DragonJiang2

【摘要】

：

分层强化学习方法可用于解决维数灾难问题,MAXQ方法通过分层地分解值函效,将任务分解为不同层次上的子任务,从而只需在低维空间中解决问题。针对MAXQ方法。首先介绍其基本原

【作者】

：

安岭丽彭志平李铁鹰

【机构】

：

茂名学院计算机与电子信息学院,太原理工大学信息工程学院

【出处】

：

茂名学院学报

【发表日期】

：

2007年1期

【关键词】

：

分层强化学习 MAXQ 任务分解 hierarchical reinforcement learning MAXQ task decomposition

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

分层强化学习方法可用于解决维数灾难问题,MAXQ方法通过分层地分解值函效,将任务分解为不同层次上的子任务,从而只需在低维空间中解决问题。针对MAXQ方法。首先介绍其基本原理,然后介绍MAXQ方法在出租车问题中的应用,包括任务分解以及类的设计,最后用实验验证了MAXQ方法比Q-学习算法收敛快。

其他文献

广饶县节水型社会建设试点经验浅析

一、研究区域概况1.自然概况广饶县位于山东省中部偏北、黄河三角洲和东营市南部,东北部濒临渤海莱州湾,总面积1138km2。广饶县境内河流共有12条,分属小清河和支脉河两大水系

期刊

节水型社会山东省中部渑水北新河黄河三角洲水资源管理制度莱州湾节水管理试点经验淄河

岩土工程中的基坑支护工程

为了促进岩石工程综合效益的提升,我们要进行其基坑支护环节的优化,促进其内部各个环节的有效协调,以满足高层建筑建设的需要,确保其建筑整体功能的稳定运行及建设环境的稳定

期刊

岩土工程基坑支护工程研究总结方案设计

论“教学具有教育性”的必然性——兼与邓银城同志商榷

一、问题的提出"教学具有教育性"是一种必然性还是一种可能性,不同学者对此持不同的观点.

期刊

教学活动教学学教学过程邓银城思想品德教育

基于质量控制的高校教学管理系统功能拓展研究

当前高校的教学管理信息系统可以较好的实现教学的计划、组织功能,但是在提高教学质量方面乏善可陈。因此应在现有的高校教学管理信息系统的基础上增加备课管理、教研活动管

期刊

质量控制高校教学管理系统功能拓展

加强管理提高中小学校教育科研效益

一所学校办学成功与否，取决于教育质量的高低，而教育质量的高低，在很大程序上取决于学校教育科研的效益，由于教育科研管理的科学性，直接决定了学校教育科研的效益，所以，要搞好学校教

期刊

教育科研管理中小学思想管理操作管理学校教育目标管理档案管理制度管理

美国基础教育的多种办学模式

美国的基础教育，由于分州自治，一向以办学模式多样化某著称。尤其是自20世纪80年代全国性自上而下的教育改革开展以后，“择校入学”这一改革思想更为多州采纳，这就为目前总数为5，3

期刊

美国基础教育办学模式家庭学校公立学校私立学校特许学校磁石学校

MAXQ方法在出租车问题中的应用

其他学术论文