MAXQ方法在出租车问题中的应用

来源 :茂名学院学报 | 被引量 : 0次 | 上传用户:DragonJiang2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分层强化学习方法可用于解决维数灾难问题,MAXQ方法通过分层地分解值函效,将任务分解为不同层次上的子任务,从而只需在低维空间中解决问题。针对MAXQ方法。首先介绍其基本原理,然后介绍MAXQ方法在出租车问题中的应用,包括任务分解以及类的设计,最后用实验验证了MAXQ方法比Q-学习算法收敛快。
其他文献
一、研究区域概况1.自然概况广饶县位于山东省中部偏北、黄河三角洲和东营市南部,东北部濒临渤海莱州湾,总面积1138km2。广饶县境内河流共有12条,分属小清河和支脉河两大水系
为了促进岩石工程综合效益的提升,我们要进行其基坑支护环节的优化,促进其内部各个环节的有效协调,以满足高层建筑建设的需要,确保其建筑整体功能的稳定运行及建设环境的稳定
一、问题的提出"教学具有教育性"是一种必然性还是一种可能性,不同学者对此持不同的观点.
当前高校的教学管理信息系统可以较好的实现教学的计划、组织功能,但是在提高教学质量方面乏善可陈。因此应在现有的高校教学管理信息系统的基础上增加备课管理、教研活动管
一所学校办学成功与否,取决于教育质量的高低,而教育质量的高低,在很大程序上取决于学校教育科研的效益,由于教育科研管理的科学性,直接决定了学校教育科研的效益,所以,要搞好学校教
美国的基础教育,由于分州自治,一向以办学模式多样化某著称。尤其是自20世纪80年代全国性自上而下的教育改革开展以后,“择校入学”这一改革思想更为多州采纳,这就为目前总数为5,3