增量式动态概率规划的研究

来源 :东北师范大学 | 被引量 : 3次 | 上传用户:lgwfzc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无论是因为对人工智能理论研究的贡献,还是因为实际的应用前景,作为人工智能的一个重要分支,智能规划的研究价值不可小觑,近年来研究成果颇多,成绩斐然。为了让智能规划能处理更为实际及复杂的问题,当前很多研究人员热衷于不确定规划的研究,比如说概率规划。其中,很多概率规划系统研究最短路径问题,然而当环境发生变化时,原来的规划结果将不再适用或不是足够好,许多系统不得不重新进行规划。当然,环境的变化通常是渐变的,重新规划时处理的往往是相似的规划问题,所以多次的重规划中,存在大量的重复规划和搜索过程,如果完全重新独立规划,规划系统的效率是低下的,在某些领域甚至是不可容忍的。如何记住已经进行过的可以复用的规划成果,在时间和空间寻求一个均衡点,就是增量式规划的任务。尽管目前对增量式规划已经有了若干研究,但并不广泛。本文将随机概率规划问题转为马尔可夫决策过程(MDP)模型来研究,同时结合了启发式搜索的算法,用启发值的迭代计算来解决最短路径规划问题,在这基础上,研究其中规划过程的特点和规律,当环境不断变化时,我们用增量式规划的方法来重规划,重复利用了前面规划的成果,减小了再次状态空间扩展时的规模,更加快速的进行启发值的迭代计算,提高整个规划过程的效率。本文主要的工作有:提出了增量式动态概率规划的模型和定义,设计了增量式动态概率规划的状态空间生成算法、增量式动态概率规划启发值的迭代算法及增量式动态概率规划的算法。同时,本文用C++语言编写代码,在Linux系统环境下开发了赛车问题域的增量式动态概率规划系统,实现了该算法。用大量实例进行测试,结果验证了算法的有效性,特别是进行重规划时,大大减小了状态空间的再扩展规模和启发值迭代计算的次数,从而节省了规划时间,提高重规划的效率。
其他文献
虚拟视觉坐标测量机是坐标测量中一个新的研究领域,有着重要的理论意义和广阔的应用前景。本文主要对视觉坐标测量的仿真环境进行研究,包括对视觉坐标测量机的仿真模型及其仿
图像检索的主要技术包括:图像特征的提取,图像特征的索引及检索。基于颜色直方图的图像检索可以快速地提取出图像索引,但颜色直方图仅仅表示图像中各种颜色的统计分布,而没有
网络的发展加大了安全类软件的需求,而与之相悖的是安全类软件的高难度、高风险,周期长的特点。为解决这一问题,对安全中间件软件的研究逐渐发展了起来。在此背景下,本文根据
P2P流媒体直播系统通常采用单一码率的方式传输数据,由于网络环境、终端设备的差异以及P2P本身拓扑结构的动态变化,往往导致无法缓冲到足够的数据,另一方面,也可能无法给高带
人们对计算机网络的依赖程度越来越大,而且越来越多的系统采用了分布式体系结构,这给传统的网络安全技术带来巨大的压力。网络系统的可生存性正是在这个阶段提出来的。可生存
语义网作为一种可以建立在理解的基础上进行人与机器智能交互的网络,能够实现从“内容匹配”到“机器理解”的跨越,已成为人们未来设想和期望的网络。本体作为一种描述语义和
由于NandFlash具有体积小、大容量、省电、非挥发性和耐震性等特性,使得他才刚刚问世几年便成为了嵌入式计算机系统中存储器的主流之一。 但是NandFlash具有以下几个方面的
随着科学技术快速发展,人们对社会生产发展信息化、物联网化提出了新要求。目前还有许多传统大棚种植还停留在人工管理,或者使用上世纪西方国家的淘汰设备。现在嵌入式设备已
目前,图像和视频正成为多媒体的主要表现形式,如何有效地从大规模图像库中快速检索出用户真正需要的图像,已成为实际生活中急需解决的问题。传统的CBIR技术多通过分析图像视