论文部分内容阅读
传统的序列决策方法旨在对决策过程与决策步骤进行建模,以求解得到最优的决策序列.然而,序列决策建模过程对目标函数的确定性要求高,且序列搜索的算法多以深度优先或广度优先等遍历搜索为主,鲜有考虑搜索过程的随机性.蒙特卡洛树搜索算法(Monte Carlo tree search,MCTS)虽然适合求解随机序列搜索问题,但目前仅应用于博弈型搜索过程,鲜有探讨需要专家参与的知识约束序列决策的搜索策略,另外,传统MCTS算法往往存在搜索范围过大、收敛不及时等问题.为此,提出一种融合群决策经验型知识和部分确定型决策序列