学习人类策略在机械臂的应用研究

来源 :中国科学院大学 | 被引量 : 4次 | 上传用户:hamjh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本课题面向日益增长的服务机器人研发需求,尤其是服务机器人中的所需的机械臂,利用学习人类控制策略进行智能控制技术的研究。本文首先介绍机械臂的基础运动学控制,并提出一种机器人模仿系统。通过正向运动学,机械臂能够从关节角计算出末端位置,通过反向运动学,又能够计算出合适的关节角以期到达设定的末端位置。通过捕捉系统,如Kinect,在得到人体运动信息的基础上,模仿系统将人运动映射到机器人的关节角,从而使得机器人能够实时模仿人运动。机器人模仿系统只是尽量精确地复制人的运动,学习人类控制策略引入学习的方法提取运动策略。其一般划分为三阶段:示例阶段,学习阶段和复制阶段。在示例阶段,人类导师主动地控制机器人完成一些运动,并将运动中机器人的状态变量存储起来。学习阶段通过机器学习的方法,从示例中学习一个控制模型,该模型需要具有泛化能力。当机器人遇到不同的场景时,复制阶段利用学习到的模型得到一个具有相似特征的轨迹。同时我们还需要考虑鲁棒性问题,即学习到的轨迹具有稳定性,总是能够到达特定的目标点。本文的算法是基于极限学习机,通过将机械臂点到点的运动建模为自治动态系统,即不显含时间变量的动态方程,并利用该方法进行学习。在给定初始点和目标点的基础上,算法利用数值积分完成复制阶段的轨迹生成。我们通过李雅普诺夫控制理论推导出能够使该系统具有全局和局部渐进稳定的约束条件,并将这些条件加入到基于优化的学习中去。该系统结构简单,易于实现,且能取得很好的泛化性和鲁棒性。我们实现该系统,并在数据集上进行模拟和在Nao机器人上进行实验。模拟和实验结果能充分验证学习到的系统的稳定性,而且对于时间扰动和空间扰动,该系统都能有很好的鲁棒性。
其他文献
通信控制器是现场总线通信控制单元中的重要组成部分,用于实现现场总线低层协议。目前,出于减轻主CPU 负担的考虑,低层通信协议大多由专用硬件实现,这就使得通信控制器的成本
在网络信息时代,信息已成为社会稳定和发展的重要战略资源,如何保证信息的安全逐渐成为人们关注的焦点。密码技术作为解决安全问题的有效手段,在各种安全解决方案中得到了广泛的