基于双空间交替学习的机器人轨迹规划研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:wxn222007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器人技术反映着一个国家的科学技术水平,是当代最具有重要战略意义的产业之一,而随着机器人技术的发展,其应用场景越来越复杂多变,传统的固定作业机器人无法满足生产要求,机器人要求被赋予更灵活快速的应激能力和更智能的行为。机器人运动技能的获取与泛化就是赋予机器人智能的一种重要方法,而基于示范学习加强化学习的框架(LfDRL)的运动技能获取方法,应用最为成功,本文基于策略表示、模仿学习和优化的三段范式LfDRL框架,针对在特定的性能约束条件下根据演示任务自主完成新的任务这一热点问题,提出了一种基于改进的局部加权回归(iLWR)、路径积分策略提升(PI~2)和基重组的运动技能学习方法(iLWR-PI~2-AL)。由于经典的LWR-PI~2方法训练过程中基函数固定,可能不适用于新任务,对此本文加入基函数自重组和iLWR双摄动方法,让算法在双空间里交替学习,将逐渐实现从熟悉任务到新任务的泛化学习。本文的研究内容如下:首先,本文研究了国内外的机器人发展现状,然后通过大量文献调研了与本文密切相关的模仿学习、强化学习以及与前两者相结合的深度学习方法。然后,本文介绍了机器人运动学的基本知识,包括正逆运动学、D-H坐标表示法,讨论了机器人研究中常见的运动解耦和关节冗余问题。其后,本文基于DMPs-iLWR和DMPs-GMR模仿学习方法,总结出一个模仿学习的统一框架,紧接着基于模仿学习,通过PI~2强化学习实现技能泛化,本文比较分析了iLWR-PI~2和GMR-PI~2两种方法的优劣势,提出了基于双空间交替学习的iLWR-PI~2策略提升方法(iLWR-PI~2-AL),该方法通过权空间和基空间的交替优化寻找任务的最优/次优解,最后从理论层面解释了双空间学习的可行性。最后本文分别用SCARA、平面十连杆、NAO和UR5机器人作为实验平台验证所提出的算法,前两种机器人仅用MATLAB作仿真实验,后面两种在仿真后用实物进行验证,结果表明该算法性能优秀。
其他文献
代偿取回权指当取回权标的物被非法转让或灭失时,该财产的权利人有权取回其对待给付财产或补偿金。因代偿取回权与赔偿请求权存在重大差别,故代偿取回权的行使更能公平保护财产权利人的正当权益。我国现行《企业破产法》没有规定代偿取回权制度。2013年最高人民法院颁布的《关于适用<中华人民共和国企业破产法>若干问题的规定(二)》虽然在第二十九条至第三十一条规定了代偿取回权的行使,但是仍然存在适用范围
根据新版高中课程标准中“以学生发展为本”的要求,高中数学课程不断地改革,课堂教学模式由传统的讲授式逐渐过渡到师生互动式,但是在转换的过程中发现一些问题,这些问题导致课堂教学难以达到预期效果。因此本研究将PBL(Problem-Based Learning)教学模式与高中数学教学相结合,致力于在高中数学课堂教学中提高学生的综合能力和数学素养。通过问题情境下教学,提高学生发现问题和解决问题的能力,注重
事件因果分析任务是对已发生事件间的因果关系进行判断,分析某事件对其他事件发生的影响程度,从而挖掘事件间的因果关系,进行事件预测。由于传统事件推理及事件预测方法仅针对特定场景的事件,导致其应用场景有限,难以泛化到一般事件,且方法本身难以扩展。围绕该问题,本文引入事态信息的概念,设计了基于循环神经网络的事件因果分析及事件预测模型,在推理时加入对因果关系中动态性与时变性的理解,强化了事件因果推理能力。通
作为微波平面传输线的重要类型之一的共面波导,备受各国学者的关注,然而有限金属厚度共面波导的研究仅限于理论研究,实际方面的研究非常空白,且目前介电测试技术广泛应用于工
谱聚类算法是近年来数据挖掘领域的研究热点,它基于谱图理论,有效地解决了很多实际问题。但在谱聚类的过程中,特征分解的计算复杂度通常为O(n3),限制了谱聚类算法在大规模数据中的应用。Nystr?m方法利用数据集中的一小部分抽样点,进行近似计算,逼近真实的特征空间,有效地解决了谱聚类在大规模数据上时间和空间开销的问题。针对现有的Nystr?m方法在谱聚类应用中存在聚类效果不稳定、样本代表性弱的问题,提
PBL从学生的角度来说是以问题为导向的学习模式,而从教师的角度来说是以问题为导向的教学模式,课上的问题被教师提前设计好,将学生分成学习小组,学生分组协助,通过小组讨论和研究,分析探究问题,并解决问题,基于教师的引导,讨论和总结解决问题的最佳办法,完成学习目标。PBL教学的主体是学生,主导者是教师。PBL符合“以学生为本”的教育教学理念,符合素质教育的基本要求,这种教学模式目的是培养学生的创新思维、
为了适应现代社会对具有优良特性的存储器件的需求,我们急需一种读写速度快的非易失性存储器,而铁电存储器便是一种符合以上需求的新型存储器件。铁电存储器的核心是一种具有极化特性的铁电材料,将铁电材料制备成为跟CMOS工艺相兼容的铁电电容,就可以利用铁电材料的特性来实现非易失性存储的功能。本文使用具有铁电性的新型的氧化铪材料制备铁电电容,并且使用2T2C型存储单元。目前铁电存储器读写电路设计中存在以下问题
海运承运人责任期间是海运承运人责任制度的重要组成部分,对于海洋贸易的发展有着重要影响。随着航海技术的提高,海运承运人责任期间既有的“钩至钩”模式、“港至港”模式和混合制模式在实践中暴露出来的问题也越来越多,难以满足当前海洋贸易的需要。《鹿特丹规则》创立了一种新的海运承运人责任期间模式—“收货至接货”模式,该模式虽然具有进步意义,但也存在诸多潜在风险。本文意在通过对现有三种海运承运人责任期间的深入研
在现当代国际关系中,南亚和中东这两个地区发挥着不可估量的作用,而其中具有重要代表意义的国家分别是印度和以色列。冷战期间,印度与多数阿拉伯国家关系紧密,对以色列国家态度比较冷淡。在阿以冲突中印度始终站在阿拉伯国家一边,而忽视以色列的看法。在整个冷战期间印度始终不愿和以色列正式建交,因为印度不想因以色列的关系而得罪整个阿拉伯国家和伊斯兰世界。自1992年印度与以色列正式建交,尤其进入新世纪以来,印以关
在信息化时代下,数据的安全性一直是人们关注的焦点。作为公钥密码学的重要原语之一,数字签名可以为网络通信提供安全且高效的认证方案,确保数据在通信过程中以不可篡改和不可否认的方式进行传输。随着数字签名研究的不断深入,基于不同密码体制的数字签名方案相继被提出。无证书数字签名(Certificateless Signature,CLS)的引入不仅避免了传统基于公钥基础设施的数字签名(Public Key