论文部分内容阅读
近年来,随着机器人技术的持续发展,其应用领域不断扩大。利用智能机器人通过人机交互来减轻自闭症儿童的症状是当前研究中的热点。研究表明,利用机器人能够提高自闭症儿童对于教育训练任务的参与程度,并且能够激发他们新的社会行为。然而,在面向自闭症儿童的教育训练任务时,实现自主人机交互是一个具有挑战性的问题。本文围绕自主人机交互,以服务于自闭症儿童的教育训练任务为目的,针对机器人的控制体系架构、交互对象的参与度评估以及机器人的决策制定展开研究。主要工作如下:1)针对自闭症儿童的教育训练任务进行机器人控制体系架构研究。控制体系架构规范了机器人控制系统中各模块间的依赖关系以及信息流通的方向,是实现自主人机交互的基础。首先,研究传统的自闭症儿童教育训练方法,针对“分解式操作法”和“地板时光”两种行为干预方法进行分析,提出适用于机器人干预的人机交互模式;然后,对机器人的控制范式进行分析,并给出面向自主人机交互任务的机器人特性;最后,利用ACT-R认知模型并结合传统教育训练策略与感知-认知-行动的机器人控制范式,提出面向自闭症儿童教育训练任务的机器人控制体系架构。2)针对自主人机交互过程中交互对象的参与度评估问题进行研究。从社会信号在参与度评估过程中的作用出发,分析了面向自闭症儿童教育训练任务的参与度评估过程;在此基础上,基于动态贝叶斯网络,构建了参与度评估模型的拓扑结构;考虑到训练样本少的现实状况,充分利用领域专家的先验知识对评估模型进行参数化;在此过程中,通过制定语言变量集、收集专家建议、语言变量模糊化、专家信息融合以及基于积分值法解模糊的步骤,将领域专家针对相关问题的定性描述转化为参与度评估模型的数值解,完成参与度评估模型的构建任务;最后,通过仿真实例对参与度评估模型的有效性进行了验证。3)考虑人机交互过程中交互对象的个性化问题进行参与度评估研究,以此提高参与度评估模型的泛化能力。首先,分析了自闭症儿童的个性化行为对参与度评估的影响,并基于规则对知识中的不确定性进行表示;然后,利用置信规则库对知识的不确定性进行表示,并给出置信度与概率分布之间的转换关系,结合动态环境下的参与度评估问题,建立基于分层置信规则库的参与度评估模型;最后,设置目标函数和约束条件,通过差分进化算法对参与度评估模型中的相关参数进行优化。仿真实例验证了该方法对于交互对象个性化的适应能力。4)基于自闭症儿童教育训练任务中的自主人机交互特点,对机器人的决策制定策略进行研究。首先,针对自闭症儿童的教育训练任务,基于强化学习建立机器人的决策制定框架;然后,针对机器人的决策过程进行数学描述,明确决策制定的目标;最后,提出一种层次化的机器人决策制定方法;其中,在高层次中基于模仿学习制定当前环境下的目标任务,在低层次中基于交互式Q学习实现机器人的动作选择。基于此,在机器人的决策制定过程中充分利用了监护者的外部反馈信息,并通过设计反馈信息的处理机制,在提高机器人学习效率的同时,抑制了错误的反馈信息对机器人决策制定产生的负面影响。5)面向自闭症儿童的教育训练任务进行实际应用研究。基于人形机器人NAO设计典型的教育训练方案对文中提出的参与度评估方法与机器人决策制定策略进行实际应用验证。