水下滑翔蛇形机器人滑翔控制的强化学习方法

来源 :机器人 | 被引量 : 0次 | 上传用户:tanjuan1980
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究了一种强化学习算法,用于水下滑翔蛇形机器人的滑翔运动控制.针对水动力环境难以建模的问题,使用强化学习方法使水下滑翔蛇形机器人自适应复杂的水环境,并自动学习仅通过调节浮力来控制滑翔运动.对此,提出了循环神经网络蒙特卡洛策略梯度算法,改善了由于机器人的状态难以完全观测而导致的算法难以训练的问题,并将水下滑翔蛇形机器人的基本滑翔动作控制问题近似为马尔可夫决策过程,从而得到有效的滑翔控制策略.通过仿真和实验证明了所提出方法的有效性.
其他文献
分析初中英语课堂中的板书现状,阐述思维导图的概念和内涵,探讨思维导图式板书在初中英语课堂教学中的作用和应用策略。认为应用思维导图式板书有助于凸显教学目标,升华主题;
中国青少年肥胖问题越来越严重,本文以北京市平谷区青少年肥胖研究为例,通过体能训练来干预青少年的肥胖现状。运用文献资料法、专家访谈法、实验法和数理统计法,以平谷区教
对不同比例下氮气和焦炉煤气混合后的燃烧特性进行分析,根据燃气互换性的判定方法,当焦炉煤气在焦氮混合气的含量在37%~38%时,其混合气能够替代人工合成转炉煤气稳定燃烧。在
生产性服务业与制造业的空间分布存在着协同定位效应,并且该效应受商务成本和城镇化率的影响。在工业化的不同阶段,生产性服务业与制造业的空间分布关系有所不同。工业化中期
强制隔离戒毒是我国禁、戒毒工作的重要组成部分,但强戒场所民警的心理健康问题却少有人关注。本人通过实地考察和查阅相关文献,系统分析强戒场所民警心理问题的原因、危害及
职业教育教学担负着文化基础和专业技术的双重教学任务,而职校中的大部分学生对文化基础课的学习积极性不高,因此培养学生的语文学习兴趣,提高教学质量势在必行。该文从几个
《故都的秋》被收录在人教版高中语文(必修二)的第一单元。学习本单元的用意在于让学生们体会作品中所描述的美景,由此进入一种审美境界。郁达夫在散文中所描绘的五幅图景是
NP36-3804井是新堡古2平台的一口开发井,钻井液密度为1.35 g/cm3,完钻井深为4 714 m,要求水泥浆一次性封固至地面,对水泥浆的稳定性和温度敏感性提出了更高的要求。通过实验,
法律思维的培养是法学专业高等教育的核心目标之一。批判性思维的论证原理对于法律论证具有极其重要的价值和意义,可以应用于法学研究和法律实务之中。构建嵌入批判性思维的