论文部分内容阅读
一个实用的智能信息处理系统无法回避对时间元素的处理,在智能规划领域尤其是这样。正因为如此,时态规划吸引了智能规划研究者的广泛重视,成为近年来规划领域一个重要的研究主题。其中,时态推理模型的选择及其与规划推理的集成问题成为制约时态规划系统能否胜任实际需要的两个核心问题,是目前该领域研究的热门主题。在实际应用领域,时态规划系统已经在欧美国家的航天项目(如哈勃太空望远镜维修项目、深空一号探测器的运作等)中发挥了重要作用。
析取时态问题是KostasStergiou和ManolisKotlbarakis在1998年提出的基于时间点的定量时态模型。目前研究文献中对该问题的求解基本上依赖于标准的约束可满足算法或者命题可满足算法,这两类算法在求解效率的比较上呈现此消彼长的竞争局面。目前,基于命题可满足算法取得了最高的求解效率。通过分析应用于析取时态问题求解的约束可满足算法标准启发式技术,作者发现析取时态问题的表示中隐含了大量可用于改善求解速度的与问题结构相关的启发式信息。然而,目前研究文献中尚未有相关技术的报道。为了表达析取时态问题的结构信息,本文提出了析取时态问题的图模型一析取时态网络。每个析取时态问题唯一对应一个析取时态网络;给出了“一致性无关边”定义,设计了获取一致性无关边的若干规则。在此基础上,定义了随着求解过程的进行通过一致性无关边的删除或操作而得到的演化析取时态网络。根据求解过程中产生的当前部分解的距离图和演化析取时态网络及其距离图,以及约束可满足问题求解中值选择“成功优先”、变量选择“失败优先”的基本原则,本文首次提出了定性值选择策略(称为TVS策略),以及基于各种定量启发式函数(称为冲突系数)的定量值选择和变量排序策略(统称为TVO策略),以及它们的改进措施用于指导约束可满足求解过程中的值和变量的选择。并证明了相关的性质,设计实现了析取时态问题求解器Graph-DTP,通过随机析取时态问题上的实验验证了它的有效性。
析取时态问题强大的表达力使得它可以承担更多(时态)调度推理方面的工作,将其作为时态规划中时态推理模块可以更好地平衡规划和调度模块的计算量。然而,已有的同类时态规划器中往往使用已有的析取时态问题求解器作为时态推理引擎,在规划进行到特定时候调用该引擎进行时态一致性的判定。这种方法每次调度模块的调用需要重新进行计算(即规划模块和调度模块是松散耦合的),导致之前已有的计算结果无法得到有效利用,造成计算上的浪费并最终导致这种时态规划器的低效性。在Graph-DTP的基础上,本文基于激活型连续动态约束可满足问题的框架设计实现了一个时态规划算法--LP-TPOP。LP-TPOP中的值和变量评价函数可以从Graph-DTP中的冲突系数定义中得到,此时LP-TPOP中规划模块和Graph-DTP调度模块是紧密耦合的。这种耦合方式除了可以实现时态推理算法的动态性优势,还可以灵活安排LP-TPOP和Graph-DTP(即规划和调度模块)的执行次序,从而为实现一个高效的时态规划器提供了另一种思路。
与同类研究文献类似,本文实现的DTP求解器Graph-DTP在标准的随机问题上进行了实验验证,LP-TPOP原型算法也在标准测试问题上进行了实验。实验结果表明,本文提出的启发式技术可以有效提高析取时态问题求解效率(即获得更少的一致性检查次数,以及耗费更少的CPU时间)。得到的最好的启发式函数及其改进措施的组合可以获得比现有的同类技术减少一个数量级以上的访问节点数和耗费的CPU时间,且这种优势随着问题规模和难度的增大变得更加明显。在测试问题集上,Graph-DTP比TSAT++(目前最快的基于命题可满足的析取时态问题求解器)获得更快的求解速度。虽然是原型算法,LP-TPOP在测试问题上仍然具有相当的求解速度。